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本 书 是 算法 竞赛 的 人 门 和 进 阶 教材 ,包括 算法 思路 、 模 板 代码 、 知 识 体系 .赛事 相关 等 内 容 。 本 书 把 竞 
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推 荐 序 


大 学 生 算法 竞赛 ,例如 ICPC( 国 际 大 学 生 程序 设计 竞赛 )、CCPC( 中 国 大 学 生 程序 设计 
竞赛 ) ,是 目前 中 国 最 具 影 响 力 的 大 学 生计 算 机 赛事 。 

这 些 算法 竞赛 之 所 以 具有 很 大 的 影响 力 , 是 因为 它们 综合 考察 了 参赛 队员 在 编码 能 力 、 
算法 知识 .逻辑 思维 、 创 新 能 力 、 团 队 合作 等 各 方面 的 素质 。 很 多 从 算法 竞赛 中 走出 的 获奖 
学 生 已 陆续 成 长 为 杰出 的 软件 工程 师 。 近 年 来 ,在 国内 、 国 际 闻名 的 IT 公司 中 ,有 算法 竞 
赛 背景 的 创业 者 也 层出不穷 。 

我 长 期 从 事 算法 竞赛 的 培训 工作 ,深刻 认识 到 算法 竞赛 在 我 国 IT 教育 中 的 关键 作用 。 
可 以 说 ,IT 行业 决定 了 一 个 国家 的 未 来 发 展 高 度 。 目 前 ,中 国 的 IT 行业 已 经 在 世界 上 颇具 
影响 力 。 中 国 每 年 培养 约 100 万 信息 类 大 学 生 ,但 仍然 供不应求 。 特 别 是 高 级 软件 工程 师 ， 
更 是 各 大 企业 、 创 业 公司 争 抢 的 对 象 。 算 法 竞赛 的 目标 正 是 培养 杰出 的 软件 工程 师 , 并 且 中 
国 20 多 年 的 算法 竞赛 历史 已 经 证 明 ,算法 竞赛 培训 是 非常 有 效 的 手段 。 

随 着 算法 竞赛 的 发 展 ,全 国 大 部 分 高 校 陆续 开展 了 算法 竞赛 的 课 内 或 课外 课程 ,各 大 学 
的 竞赛 指导 老师 为 之 付出 了 极 大 的 心血 。 

算法 竞赛 不 同 于 其 他 的 学 科 竞 赛 , 它 的 长 期 性 ,艰苦 性 使 它 成 为 一 个 高 难度 的 学 习 活 
动 。 参 赛 队 员 需 要 长 期 持之以恒 地 学 习 、 训 练 ,指导 老师 也 需要 在 竞赛 培训 .教材 编写 .日 常 
管理 .组 织 参 赛 .主办 比赛 .维护 OJ 系统 等 方面 做 大 量 琐碎 而 艰苦 的 工作 。 竞 赛 教材 的 编 
写 是 其 中 一 项 重要 内 容 , 近 些 年 ,国内 也 陆续 出 版 了 十 几 种 相关 教材 ,这 些 都 是 算法 竞赛 学 
生日 常 学 习 的 基本 资料 。 

我 的 同行 罗勇 军 老师 是 华东 理工 大 学 的 竞赛 教练 ,长 期 从 事 算法 竞赛 的 指导 工作 。 我 
和 罗 老 师 很 早 就 认识 ,虽然 不 常见 面 , 但 网 络 交流 很 频繁 ,经 常 就 竞赛 学 生 的 有 效 管理 模式 
进行 经 验 交流 。 

令 我 印象 深刻 的 是 ,2008 年 我 校 (杭州 电子 科技 大 学 ) 主 办 了 ACM-ICPC 亚洲 区 域 赛 ， 
罗 老 师 带 领 的 参赛 队 一 举 获得 金牌 ,并 因此 入 围 了 次 年 于 瑞典 举办 的 第 33 届 ACM-ICPC 
World Final, 这 让 当时 的 我 既 羡 莫 ,又 深 受 鼓舞 。 一 年 后 ,我 校 也 实现 了 Final 的 历史 性 突 
破 , 并 在 接 下 来 的 几 年 中 先后 5 次 人 围 全 球 总 决赛 。 

罗 老 师 作为 一 名 十 几 年 坚持 在 教学 第 一 线 的 金牌 教练 ,在 总 结 长 期 的 算法 竞赛 教学 经 
验 的 基础 上 写 下 了 《算法 竞赛 入 门 到 进 阶 ) 一 书 。 通 读 下 来 ,这 本 书 的 语言 描述 贴近 学 生 的 
阅读 习惯 ,有 很 好 的 可 读 性 ,对 基础 算法 的 讲解 详细 清晰 、 通 俗 易 懂 ; 仔细 读 之 ,读者 能 够 
深刻 感受 到 作者 为 之 付出 的 心血 。 

书 中 的 例题 大 部 分 来 自 杭州 电子 科技 大 学 在 线 提交 系统 (HDOJ) ,这 让 我 倍 感 亲切 。 
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同时 我 想 , 这 对 于 国内 的 读者 来 说 也 一 定 是 乐于 看 到 的 ,毕竟 绝 大 部 分 参加 竞赛 的 学 生 都 是 
HDOJ 的 用 户 。 

总 之 ,希望 罗 老 师 的 这 本 《算法 竞赛 入 门 到 进 阶 ) 能 给 广大 的 参赛 学 生 带 来 实 实在 在 的 
帮助 。 


刘 春 英 
杭州 电子 科技 大 学 
2019 年 6 月 
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算法 竞赛 ,例如 ACM-ICPC、CCPC 等 ,在 中 国 已 经 活跃 多 年 ,是 最 具 影 响 力 的 大 学 生计 
算 机 竞赛 。 目 前 ,已 经 出 版 的 算法 竞赛 书 也 有 30 多 部 ,有 一 些 被 队员 们 奉 为 “ 宝 书 ”, 有 很 好 
的 口碑 。 本 书 作者 是 竞赛 教练 ,因为 工作 的 原因 ,详细 阅读 过 这 些 书 。 这 些 书 ,或 者 讲解 深 
刻 让 人 佩服 ,或 者 娓 九 道 来 令 人 愉悦 ,或 者 洋洋 大 观 让 人 欲罢不能 。 读 经典 书 , 甘 之 如 馅 。 

在 多 年 的 竞赛 教练 工作 中 ,本 书 作者 作为 喜欢 自我 表现 的 社会 人 ,也 常常 跃跃欲试 , 试 
图 写 出 一 本 新 的 经 典 书 。 本 书 作者 认为 ,竞赛 队员 在 算法 竞赛 学 习 中 的 痛 点 需求 如 下 。 

算法 思路 : 一 点 就 透 , 治 然 开朗 。 

模板 代码 : 结构 精巧 ,清晰 易 读 。 

知识 体系 : 由 浅 入 深 ,逐步 推进 。 

赛事 相关 : 参赛 秘籍 ,高 手 经 验 。 

上 面 立 的 几 个 flag 虽然 高 不 可 梦 , 但 确实 是 本 书 作者 内 心 的 旗帜 。 

本 书 是 一 本 “竞赛 书 ”, 不 是 计算 机 算法 教材 ,也 不 是 编程 语言 书 ,因此 对 大 多 数 知识 点 
本 身 不 会 做 过 多 的 讲解 ,而 是 把 重点 放 在 讲解 竞赛 所 常用 的 知识 点 上 ,以 及 如 何 把 知识 点 和 
竞赛 题 结合 起 来 。 当 然 , 由 于 编程 竞赛 涉及 太 多 知识 点 ,一 本 竞赛 书 不 可 能 面面俱到 ,把 所 
有 内 容 都 堆砌 进来 。 市 面 上 还 有 太 多 经 典 的 算法 教材 和 编程 语言 教材 ,这 都 是 竞赛 队员 应 
该 认真 阅读 的 。 

本 书 对 知识 点 进行 了 精心 的 剖析 。 很 多 知识 点 看 起 来 复杂 难 解 ,但 如 果 结 合 清晰 的 代 
码 、 生 动 的 文字 、 通 俗 的 比喻 一目了然 的 图 解 画龙点睛 的 注解 ,就 能 让 人 稿 然 开朗 。 这 也 
是 本 书 的 目标 。 

代码 能 力 体 现 了 编程 者 的 实力 。 学 习 别 人 的 好 代码 是 提高 自己 编码 水 平 的 捷径 。 本 书 
把 知识 点 讲解 和 竞赛 题目 紧密 地 结合 在 一 起 ,同时 给 出 实用 的 代码 。 这 些 代码 有 的 是 作者 
精心 组 织 和 编写 的 ,有 的 是 搜索 大 量 资料 后 进行 整理 总 结 的 结果 。 其 中 很 多 代码 完全 可 以 
作为 编程 的 模板 ,希望 能 对 参赛 学 生起 到 参考 的 作用 。 特 别 是 经 典 问题 ,往往 有 经 典 代码 ， 
凝结 了 很 多 人 的 劳动 。 本 书 作者 并 没有 独创 经 典 代码 的 能 力 , 因 此 书 中 不 可 避免 地 引用 和 
改写 了 一 些 公开 的 代码 。 对 于 一 些 能 找到 出 处 的 经 典 代码 ,在 书 中 都 标注 了 出 处 。 

本 书 主要 面向 初学 者 和 中 级 进 阶 者 。 初 学 者 面 对 海量 繁杂 的 竞赛 知识 点 往往 会 产生 深 
深 的 无 力 感 和 挫折 感 ,本 书 由 浅 入 深 地 讲解 知识 点 ,逐步 推进 ,帮助 初学 者 建立 自信 心 ,从 而 
快速 地 从 能 理解 的 实际 问题 和 人手 ,模仿 经 典 代码 解决 问题 ,进入 中 级 学 习 阶段 。 

竞赛 是 很 专业 的 活动 ,经 验 非 常 重要 。 书 中 就 一 些 日 常 训练 和 参赛 的 细节 问题 介绍 了 
作者 的 体会 。 

学 习 算 法 竞赛 有 很 大 难度 ,需要 精通 编程 语言 .掌握 很 多 算法 ,但 是 这 并 不 意味 着 需要 
先 学 好 算法 和 编程 语言 才能 进行 竞赛 训练 。 事 实 上 ,建议 初学 者 从 零 基 础 就 开始 学 习 算 法 


算法 竞赛 入 门 到 进 阶 


编程 竞赛 ,与 算法 学 习 和 语言 学 习 同 步 进行 。 竞 赛 是 操练 的 擂台 ,竞赛 题目 把 知识 点 和 具体 
问题 结合 起 来 ,让 学 到 的 知识 有 了 打击 的 “ 力 点 ”。 

以 上 是 本 书 的 特点 ,希望 本 书 能 给 算法 竞赛 的 初学 者 和 进 阶 学 习 者 以 较 大 的 帮助 。 如 
果 是 初学 者 ,通过 本 书 可 以 快速 入 门 , 例 如 了 解 竞赛 的 知识 点 、 建 立 算法 思维 ,动手 写 出 高 效 
率 的 代码 。 如 果 是 中 级 进 阶 者 ,学 习 本 书 , 可 以 更 透彻 地 掌握 复杂 算法 的 思想 ,学 习 经 典 代 
码 、 完 善 知识 体系 ,从 而 更 自信 地 加 入 到 竞争 激烈 的 比赛 活动 中 。 

本 书 提供 教学 大 纲 、 教 学 课件 程序 源码 ,扫描 封底 的 课件 二 维 码 可 以 下 载 ; 本 书 还 提 
供 120 分 钟 的 视频 讲解 ,扫描 书 中 的 二 维 码 可 以 在 线 观看 。 

在 本 书 的 编写 过 程 中 ,华东 理工 大 学 竞赛 队员 提出 了 一 些 建 议 , 感 谢 2015 级 队长 姚 远 ， 
以 及 王 亦 凡 \ 王 泽 宕 、 例 天 东 \ 傅 志 凌 等 队员 。 


作 者 
2019 年 5 月 


第 1 童 算法 竞赛 概述 站 


E 交 


加 
下 
i 


1 


a 


.1.1 编写 大 量 代 码 钼 #… 
.1.2 丰富 的 算法 知识 …… 
.1.3 计算 思维 和 逻辑 思维 
.1.4 团队 合作 精神 

算法 竞赛 与 创新 能 力 的 培养 . 

算法 竞赛 人 门 ， 


2 判 题 和 基本 的 输入 与 输出 
3 测试 频 。… 
编码 速度 


ww 


F 隐 
了 


天 赋 与 勤奋 
学 习 建 议 
本 书 的 特点 


竞赛 语言 和 训练 平台 钼 ee 


和男 计 | 泛 庆 易 且 度 Re 


2. 


计算 的 资源 


人 贡 计 的 定 双 | 须 5 


2.3 算法 的 评估 
第 3 章 STL 和 基本 数据 结构 


3. 


a 


容器 

3.1.1 vector 钼 4… 
3.1.2 栈 和 stack …… 

a be) 队列 和 二 


3. 了 六 先 队列 和 人 piioiity _ die0e 53 


3.1.5 链表 和 list ……………- 


3. 


3 3 next_permutation() DO OPE OA EN 
ED 


递归 和 排列 葡 @… 
子 集 生成 和 组 合 问题 


4 
i 
并 查 集 匡 作 0 


5. 
5. 


Ee 


6. 


呆 而 世 


cn on 


2 


.4 


5 


| 
2 


4 
5 


和 


3.1.6 
S17 


SOTtO eee 


BFS 

4.3.1 
Rr 
4.3.3 
.3.4 
DFS 

4.4.1 
.4.2 
.4.3 
.4.4 


小 结 


二 叉 树 


om ma mn a 


5. 3. 1 
5. 3. 2 
5. 3.3 
5. 3.4 
5. 3.5 


树 状 数组 葡 @………… 


小 结 


贪心 法 


算法 竞赛 入 门 到 进 阶 


Set 


和 


BFS 和 队列 病 @@……… 
八 数码 问题 和 状态 图 搜索 ……… 
BFS 与 A* 算 法师 % 
双向 广 搜 


DFS 和 递归 pp 

回潮 与 剪 校 ， 
和 迭代 加 深 搜索 

IDA * 


三 疯 漳 前 逢 也 erenissedarnianesss 
二 又 树 的 遍历 鼎 @ ……………… 
ts Go eeeaeaeeaGR 
Treap 树 [0 eS 
Splay 树 

各 机 人世 
点 修改 . a 
离散 化 … 
区 间 修改 师 。 - 
线段 树 习 题 


Co 


cm en aa en on 
Nw 


2 2 


Om on 中 叫嚣 
四 外 站 位 


< 
-3 


ea 
oo 


< 
Oo 


6.1.1 基本 概念 


6.1.2 常见 问题 鼎 @… 
6.1.3 Huffman 编码 [i 
6.1.4 模拟 退火 

6.1.5 习题 


三 冯 分 治 法 和 


6. 2.1 归并 排序 


6.3 减 治 法 ， 
6.4 小 结 


i 


硬币 问题 


Tl 
(人 区/ 

7.1.3 最 长 公共 子 序列 
7.1.4 最 长 递增 子 序列 
7.1.5 基础 DP 习题 … 


区 间 DP .oo 


ed ba 


A 
中 


汪汪 


8.1 高 精度 计算 钴 @ 


快速 寡 

GCD、LCM ee 
扩展 欧 几 里 得 算法 与 二 元 
同 余 与 逆 元 

6 


GE 
NonNno co 
一 


ST 梦 浊 丹 关 ， asseapparaspskaa 
8.3.2 杨辉 三 角 和 二 项 式 系数 
8.3.3 容 斥 原理 


Bee: on he 


目录 


6. 2.2 快速 排序 频 。… ee 


0/1 背包 [LH TTT 
天 与 记忆 化 过 兰 。 weneeeeeeeee 


8.4 
8.5 


8.6 


第 庙 计 ” 守 午 且 damien 


CoOLoOoLw 
中 


中 


算法 竞赛 入 门 到 进 阶 


8.3.5 母 函数 钼 ne 


8. 3.6 特殊 计数 
概率 和 数学 期 望 
公平 组 合 游戏 锯 …… 


8.5.1 巴 什 游戏 与 P-position、N-position pe 


8.5.2 尼 姆 游戏 


8.5.3 图 游戏 与 Sprague-Grundy 函数 ee 


8.5.4 威 佐 夫 游戏 


9.6.1 概念 
9.6.2 Ee 


Po 


(oR re 
0.7.1 Kosaraju 算法 频 人 RN 
0.7.2 Tarjan 算法 
2-SAT 问题 [0 a 


0.9.1 Floyd-Warshall ………… 
0.9.2 Bellman-Ford [A Se 


rt | EE OT TO 


目录 


10. 9.4 Dijkstra 

0.10 最 小 生成 树 
10. 10.1 prim 算法 
10. 10.2 kruskal 算法 

ld 
10. 11.1 Ford-Fulkerson 方法 [0 ee 
10. 11.2 Edmonds-Karp 算法 一 ………… 


.12 最 小 制 
.13 最 小 费用 最 大 流 


| 


1.1 二 维 几何 基础 其 ………… 
1 点 和 向 量 弓 e ………… 


多 边 形 … 


最 近 点 对 … 
旋转 卡 壳 … 


oo 口上 中 忆 


.2.1 基本 计算 … 


.3.1 三 维 点 和 向 量 ………… 


i 
1. 3.4 ”最 小 球 覆 盖 …………… 


几何 模板 锯 …- 


ls 
lls 


心 


a 


12.1 ICPC 亚洲 区 域 赛 (中 国 大 陆 ) 情 况 


由 el a 
12.2.1 F 题 Friendship of Frog(hdu 5578) ee 


0 各 :六 站 让 第 法 和 古 AE 售 法 vemesmpapoeate ree 


0 
0 Ee a 

0.14 二 分 图 匹配 多 
0 EPEETIETIRITETE 


300 


315 


”316 


参考 文献 


四 oo 号 


算法 竞赛 入 门 到 进 阶 


K 题 Kingdom of Black and WhiteChdu 5583) 


L 题 LCM Walk(hdu 5584) eee 
A 题 An Easy Physics Problem(hdu 5572) :ee 
“ 2 
* 328 


B 题 Binary Tree(hdu 5573) …………eeeeeee 
D 题 Discover Water Tank(hdu 5575)… 
E 题 Expection of String(hdu 5576) 


G 题 Game of Arrays(hdu 5579) eeeeeeeeeee 
"339 


I 题 Infinity Point Sets(hdu 5581) 


" 320 


323 
325 


336 


* 344 


第 1 章 算法 竞赛 概述 


扣 算 法 竞赛 简介 

吕 创 新 能 力 的 培养 

局 训练 平台 

局 入 门 知识 

茹 模板 的 作用 

名 题目 分 类 

如 学 习 计 划 

算法 竞赛 是 培养 大 学 生 程 序 设计 能 力 .计算 思维 能 力 、 创 新 能 力 和 团队 合作 精神 的 重要 
方式 ,是 培养 杰出 程序 员 的 捷径 ,被 国内 高 校 普遍 重视 ,吸引 着 越 来 越 多 的 大 学 生 参 与 其 中 。 

本 章 介 绍 了 与 竟 赛 相关 的 入 门 知识 ,包括 竞赛 语言 及 训练 平台 、 编 码 规范 .题目 分 类 、 模 
板 的 作用 等 。 在 本 章 的 最 后 部 分 讨论 了 天 赋 和 努力 与 竞赛 成 绩 的 辩证 关系 ,并 详细 地 给 出 
了 学 习 建 议 。 


算法 竞赛 (程序 设计 竞赛 ) 是 培养 杰出 程序 员 的 捷径 。 

在 当前 高 等 教育 强化 创新 能 力 培养 .逐年 增 大 学 科 竞赛 投入 的 背景 下 ,出现 了 一 大 
批 面向 大 学 生 的 算法 类 竞赛 。 在 国内 众多 竞赛 中 ,最 具 影 响 力 的 面向 大 学 生 的 程序 设计 
竞赛 有 ACM-ICPC 和 CCPC 等 ,面向 中 学 生 的 程序 设计 竞赛 有 全 国 青少年 信息 学 奥 林 匹 
克 竞 赛 。 

ACM-ICPC(International Collegiate Programming Contest, 国际 大 学 生 程序 设计 竞 
赛 )9 是 国际 和 国内 最 有 影响 力 的 高 校 计算 机 竞赛 ,是 旨 在 展示 大 学 生 创 新 能 力 、 团 队 精神 
和 在 压力 下 编写 程序 分 析 和 解决 问题 能 力 的 年 度 竞赛 。 经 过 多 年 的 发 展 ,ACM-ICPC 已 
经 成 为 全 球 最 具 影 响 力 的 大 学 生 程序 设计 竞赛 , 它 也 成 为 我 国 高 校 创新 教育 评估 的 主要 竞 
守之 一 。 

CCPC(China Collegiate Programming Contest ,中国 大 学 生 程序 设计 竞赛 )2 是 由 中 国 
大 学 生 程序 设计 竞赛 组 委 会 主办 的 面向 世界 大 学 生 的 国际 性 年 度 赛 事 , 旨 在 激发 学 生 学 习 
算法 和 程序 设计 的 兴趣 ,提升 算法 设计 、 逻 辑 推理 、 数 学 建 模 、 编 程 实现 和 英语 阅读 能 力 , 激 
励 学 生 运 用 计算 机 编程 技术 和 技能 解决 实际 问题 ,培养 团队 合作 意识 、 挑 战 精神 和 创新 潜 
力 。 中 国 大 学 生 程 序 设计 竞赛 是 ACM-ICPC 在 中 国 发 展 的 必然 产物 。 


四 “网址 为 icpe. baylor. edu。 从 2018 年 起 ,ACM 协会 不 再 赞助 ICPC, 因 此 众所周知 的 ACM-ICPC 竞赛 应 该 改 为 
ICPC。 本 书 由 于 需要 介绍 竞赛 的 历史 ,这 里 仍然 沿用 ACM-ICPC 这 个 名 称 。 
回 网址 为 ccpc. io。 
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NOI(National Olympiad in Informatics, 全 国 青少年 信息 学 奥林匹克 )@ 是 国内 省 级 代 
表 队 最 高 水 平 的 大 赛 。 每 年 各 省 选拔 产生 5 名 选手 ,由 中 国 计 算 机 学 会 组 织 进行 比赛 。 

“学 科 竞 赛 不 仅 是 高 校 创新 人 才 培 养 的 重要 手段 ,而 且 是 用 人 单位 选拔 人 才 的 重要 依 
据 ?@, 算 法 竞赛 完全 证 明了 这 一 点 。 搜 索 所 有 著名 IT 公司 招聘 软件 工程 师 的 面试 题目 就 
会 发 现 ,没有 经 过 算法 竞赛 训练 的 人 很 难 通过 这 些 面 试 。 

算法 竞赛 是 展示 编程 能 力 的 大 舞台 。 练 武 的 人 ,如 果 有 一 个 比武 的 擂台 ,可 以 极 大 地 激 
发 他 们 的 活力 ,并 让 他 们 有 机 会 证 明 自 己 不 是 纸上谈兵 ,而 是 真正 的 高 手 。ACM-ICPC、 
CCPC NOI 就 是 学 习 编 程 和 展示 程序 设计 能 力 的 大 擂台 。 在 学 习 的 过 程 中 ,从 简单 题目 到 
难题 ,从 一 个 专题 到 所 有 专题 ,一 步 一 步 渐进 学 习 , 让 参与 者 能 清晰 地 把 握 自己 的 进步 。 竞 
赛 题目 都 是 实打实 的 软件 小 项 目 , 完 成 它们 能 给 人 以 真实 的 成 就 感 , 并 验证 是 否 掌握 了 真正 
的 编程 本 领 。 


1.1 培养 杰出 程序 员 的 捷径 


杰出 的 程序 员 有 什么 特质 ? 这 里 可 以 列 出 一 长 串 : 掌握 多 种 编程 语言 ,编写 过 大 量 代 
码 , 算 法 知识 丰富 ,数学 应 用 能 力 强 , 做 过 很 多 项 目 , 有 团队 精神 和 创新 意识 ,善于 根据 行业 
需求 调整 自己 的 努力 方向 …… 

学 习 和 参加 算法 竞赛 是 成 为 杰出 程序 员 的 捷径 。ACM-ICPC 的 冠军 被 称 为 “世界 上 最 
聪明 的 人 ”, 竞 赛 的 获奖 者 基本 上 都 成 长 为 杰出 的 软件 工程 师 ,并 且 有 很 多 人 是 IT 公司 的 
创业 者 。 例 如 ,当前 最 热门 的 人 工 智 能 公司 ,很 多 创始 人 都 是 算法 竞赛 的 佼佼 者 。 

依 图 科技 联合 创始 人 林 晨 曦 ,2002 年 获 ACM-ICPC 总 决赛 金牌 ,2008 年 进入 阿里 云 任 
技术 总 监 , 搭 建 中 国 首 个 拥有 自主 知识 产权 的 分 布 式 计算 平台 “飞天 ”,2012 年 与 同学 朱 琉 
一 起 联合 创立 依 图 科技 。 

第 四 范式 CEO 戴 文 渊 ,2005 年 获 ACM-ICPC 总 决赛 金牌 ,在 “科学 中 国人 》2016 年 度 
人 物 ? 评 选中 ,成 为 第 一 位 代表 人 工 智能 行业 获 评 * 年 度 科技 型 企业 家 ?荣誉 的 企业 家 。 

旷 视 科 技 的 创始 人 唐 文 斌 ,2008 年 获 ACM-ICPC 总 决赛 银牌 ,他 的 公司 被 李开复 称 为 
“国内 最 成 功 的 人 工 智 能 公司 ”。 旷 视 科技 公 司 聚 集 了 很 多 算法 竞赛 获奖 的 人 才 。 唐 文 研 这 
样 评价 自己 公司 的 员工 :“ 在 我 的 团队 里 ,聚集 了 一 批 这 样 的 天 才 人 物 。 目 前 旷 视 科 技 团队 
成 员 有 60 个 左右 ,其 中 30 多 个 人 至 少 曾 获得 过 一 项 世界 级 编程 比赛 奖项 ,得 过 国际 奥 林 匹 
克 竞 赛 金牌 的 有 7 个 …… *@ 

在 ACM-ICPC 区 域 赛 上 获奖 的 学 生 , 在 大 学 生 中 比例 极 小 。 例 如 ,2017 年 亚洲 区 域 
赛 ,参赛 队员 是 从 300 个 大 学 选拔 出 来 的 ,7 个 赛区 合计 约 1700 队 。 其 中 ,金牌 10% ,170 
队 , 约 500 人 ,以 大 四 学 生 为 主 ; 银牌 20% ,340 队 , 约 1000 人 ,以 大 三 .大 四 学 生 为 主 ; 铜牌 
30%,500 队 , 约 1500 人 ,以 大 三 学 生 为 主 。 这 其 中 有 一 部 分 队伍 重复 参加 多 个 赛区 的 比 


四 ”网址 为 www. noi. cn。 
加 ”中国 高 等 教育 学 会 (高 校 竞赛 评估 与 管理 体系 研究 ) 专 家 工作 组 。 
回 ” 唐 文 斌 : 先 打 地 基 再 建 楼 ; http://m. iheima. com/article/150664( 永 久 网 址 : perma. cc/ QAE8-NKVX)。 


Ce 


第 1 章 算法 竞赛 概述 


赛 ,估算 起 来 ,每 年 毕业 的 金牌 获奖 者 不 到 500 人 ,银牌 获奖 者 不 到 1000 人 。 中 国 在 校 的 计 
算 机 类 专业 大 学 生 有 100 万 左右 ,这 还 不 算 其 他 信息 类 专业 毕业 生 。 因 此 ,ACM-ICPC 竞 
赛 获 奖 队 员 可 以 说 是 千里 挑 一 、 万 里 挑 一 的 杰出 人 才 了 。 

在 大 学 阶段 参加 算法 竞赛 ,可 以 使 一 个 未 来 的 杰出 程序 员 获 得 下 面 几 个 小 节 所 介绍 的 能 
力 。 这 些 能 力 虽然 被 视 为 “基础 能 力 ”, 但 却 是 大 部 分 学 计算 机 编程 的 学 生 所 不 能 轻易 获得 的 。 


1.1.1 编写 大 量 代 码 由 


了 。 如 果 他 没 写 过 大 量 代 码 ,就 不 要 雇用 他 .”? 通 过 编写 大 量 代码 ,能 做 到 算 
法 精妙 合理 .逻辑 清晰 透彻 .代码 喷涌 而 出 、 格 式 赏 心 悦 目 、 挑 bug 手 到 擒 来 ， 
这 是 杰出 程序 员 的 基本 功 。ACM-ICPC 竞赛 队员 想 达 到 在 区 域 赛 中 获奖 的 水 平 ,需要 写 
5 一 10 万 行 的 代码 。 


1.1.2 丰富 的 算法 知识 


算法 是 程序 的 核心 ,决定 了 程序 的 优 劣 。 特 别 是 在 数据 规模 大 的 情况 下 ,算法 直接 决定 
了 程序 的 生死 。 例 如 ,用 计算 机 处 理 排序 问题 : 假设 有 100 万 个 数 , 用 最 简单 的 冒 泡 排 序 算 
法 ,计算 量 可 能 多 达 1 万 亿 次 ( 冒 泡 排序 的 计算 复杂 度 是 OCze) ,100 万 X100 万 =1 万 亿 )， 
在 计算 机 上 ,计算 时 间 长 达 几 个 小 时 ,实际 上 根本 不 能 用 ; 如 果 改 用 快速 排序 算法 ,计算 量 
只 有 2000 万 次 (快速 排序 的 计算 复杂 度 是 O(nlogsn),100 万 Xlogs100 万 这 2000 万 ), 计 算 
机 在 1 秒 内 可 以 完成 。 二 者 的 计算 时 间 相差 5 万 倍 , 算 法 的 威力 可 见 一 斑 。 

算法 竞赛 涉及 绝 大 部 分 常见 的 确定 性 算法 ,掌握 这 些 知识 ,不 仅 能 应 用 在 软件 开发 中 ， 
也 是 进一步 探索 未 知 算法 的 基础 。 例 如 现在 非常 火爆 的 、 代 表 了 人 类 未 来 技术 的 人 工 智 能 
研究 ,涉及 许多 精深 的 算法 理论 , 没 经 过 基础 算法 训练 的 人 根本 无 法 参与 。 


1.1.3 计算 思维 和 人 逻辑 思 


一 些 竞赛 队员 经 常 说 : 我 们 要 尽量 掌握 所 有 算法 知识 。 但 是 ,程序 设计 不 仅 要 有 算法 
思想 ,还 需要 能 正确 地 写 出 程序 ,这 不 是 仅仅 有 算法 知识 就 能 完成 的 。 一 道 难题 ,往往 需要 
综合 多 种 能 力 ,例如 数据 结构 .算法 知识 数学 方法 、 流 程 和 仙 辑 等 ,这 就 是 计算 思维 和 逻辑 
思维 能 力 的 体现 。 通 常 , 能 解 出 这 样 的 题目 是 高 级 程序 员 的 特征 。 

在 ACM-ICPC 亚洲 区 域 赛 和 CCPC 赛事 上 获得 金牌 .银牌 的 队员 ,能 够 凭借 奖牌 证 实 
自己 有 这 样 的 能 力 。 这 也 是 算法 竞赛 被 看 重 的 主要 原因 。 


1.1.4 团队 合作 精神 
在 软件 行业 ,团队 合作 非常 重要 ,这 一 点 不 需要 更 多 说 明 。ACM-ICPC、CCPC 竞赛 把 
对 团队 合作 的 要 求 放 在 了 重要 位 置 。 竞 赛 的 赛制 是 3 人 一 队 , 一 台 计 算 机 ,十 几 道 竞赛 题 ， 


QO Gates:“If you want to hire an engineer, look at the guy’s code. That's all. If he hasn't written a lot of code, 
don't hire him. ”; https://www. wired. com/2010/04/ff_hackers/。 
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限定 5 个 小 时 。 参 加 过 现场 比赛 的 队伍 都 能 立刻 体会 到 : 一 个 队伍 的 3 个 人 ,在 同等 水 平 
下 ,如果 配合 默契 , 则 可 以 多 做 一 两 道 题 , 把 获奖 等 级 提高 一 个 档次 。 在 竞赛 过 程 中 ,有 人 负 
责 精读 英语 题 , 有 人 负责 构造 测试 数据 ,有 人 负责 编写 代码 ,大 家 互相 讨论 思路 ,队长 判断 现 
场 形势 ,确定 做 题 顺 序 。 每 支队 伍 的 3 个 人 只 有 在 日 常 训练 中 长 期 磨合 ,才能 互相 了 解 , 做 
到 合理 分 工 \ 优 势 互补 ,从 而 发 挥 出 最 优 的 团队 力量 。 

有 人 认为 : 毕业 后 参加 工作 ,其 实用 不 着 算法 竞赛 这 么 多 的 复杂 逻辑 和 算法 知识 ,即使 
用 到 了 ,在 工程 中 一 般 有 现成 的 模块 , 拿 来 用 就 行 了 ,只 要 了 解 这 个 模块 用 到 的 算法 的 作用 
和 复杂 度 即 可 。 这 种 认识 是 肤浅 的 ,对 于 立志 成 为 高 级 程序 员 的 学 生 而 言 ,进行 大 量 的 计算 
思维 训练 和 经 典 算法 训练 是 必需 的 ,理由 如 下 : 

(1) 算法 是 对 学 习 和 理解 能 力 的 一 块 试金石 . 难 的 都 能 掌握 ,容易 的 当然 不 在 话 下 。 在 
算法 竞赛 上 获奖 的 人 证 明了 自己 有 解决 复杂 编程 问题 的 能 力 。 

(2) 即使 有 现成 的 模块 ,但 是 对 于 特定 的 需求 ,往往 需要 进行 修改 才能 真正 使 用 ,没有 
真正 理解 的 人 无 法 修改 。 

(3) 实际 的 程序 往往 有 复杂 的 逻辑 关系 ,但 又 不 属于 经 典 的 算法 ,没有 现成 模块 ,需要 
自己 思考 才能 写 出 代码 ,这 个 能 力 是 通过 训练 得 到 的 。 


1.2 算法 竞赛 与 创新 能 力 的 培养 


算法 竞赛 培养 这 样 的 能 力 : 对 复杂 问题 ,用 高 效 的 算法 或 逻辑 进行 建 模 并 编码 实现 。 

目前 中 国 的 IT 业 极 其 繁荣 ,已 经 和 美国 并 列 为 世界 超级 两 强 ,把 其 他 国家 和 地 区 和 远 远 
抛 到 后 面 ,并 且 中 国有 加 速 超 过 美国 的 趋势 。 繁 荣 意 味 着 竞争 激烈 ,参加 编程 竞赛 的 获奖 队 
员 能 够 在 成 千 上 万 的 IT 工程 师 中 脱颖而出 ,有 很 多 创业 并 成 功 。 本 书 作者 认为 ,他 们 需要 
具备 以 下 品质 : 

(1) 激情 和 勇气 。 例 如 ,一 旦 开始 ,就 不 肯 退 缩 的 激情 ; 渴望 成 为 大 人 物 , 有 改变 行业 
的 野心 ; 敢于 平等 地 和 老师 IT 行业 人 士 进行 交流 的 勇气 。 本 书 作者 所 在 的 华东 理工 大 学 
有 一 些 竞赛 队员 毕业 后 创业 成 功 ,他 们 在 大 一 的 时 候 就 已 经 表现 出 了 这 些 特点 。 例 如 创办 
杭州 美 登 科技 有 限 公司 (淘宝 的 金牌 “ 淘 拍 档 ”) 的 2008 届 毕 业 生 邹 宇 、 创 办 上 海 昔 果 信息 科 
技 有 限 公 司 ( 中 国手 游 企业 的 明星 ) 的 2009 届 毕 业 生 尹 庆 ,在 大 一 的 时 候 就 表现 出 了 不 服 
输 、 敢 于 承担 的 特点 ,他 们 先后 担任 了 竞赛 队长 。 

(2) 开阔 的 思路 。 能 抓 住 一 切 机 会 了 解 更 多 的 信息 。 例 如 创办 云 片 网 络 的 华东 理工 大 
学 的 2007 届 毕 业 生 刘 大 林 ,他 在 读 大 三 的 时 候 发 现 学 校 主页 没有 校内 搜索 功能 ,于 是 主动 
做 了 一 个 搜索 ,并 推销 给 了 学 校 。 再 如 华东 理工 大 学 的 2012 届 毕 业 生 诸 咏 天 ,在 大 学 期 间 
访问 了 很 多 创业 公司 ,开阔 了 思路 ,在 大 学 期 间 就 积极 创业 ,荣获 “2011 年 上 海 市 大 学 生年 
度 人 物 ” 的 称号 ,毕业 后 创业 并 取得 成 功 。 

(3) 超群 的 技术 能 力 。 这 一 点 非常 重要 。 由 于 现在 IT 行业 早已 进入 成 熟 阶段 ,从 业者 
人 数 太 多 ,竞争 激烈 ,所 以 只 有 具备 超群 技术 能 力 的 人 才能 快速 开发 出 难以 模仿 的 软件 , 增 
加 获得 成 功 的 概率 。 

(4) 自信。 自信 不 是 盲目 的 自 大 ,自信 的 获得 建立 在 征服 困难 的 经 验 上 。 例 如 ,参加 过 
。 4 。 
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ACM-ICPC 和 CCPC 竞赛 的 学 生 , 由 于 经 历 了 长 期 的 非常 困难 的 学 习 , 在 编程 能 力 上 远 远 
超越 了 大 部 分 学 生 , 从 而 建立 了 超 强 的 自信 。 

(5) 团队 建设 。 竞赛 的 队员 ,在 长 期 的 共同 学 习 和 参赛 的 过 程 中 团结 合作 、 共 同 进 步 ， 
结 下 了 深厚 的 友谊 ,是 未 来 创业 的 好 伙伴 。 


可 


1.3 ”算法 竞赛 入 门 


1.3.1 竞赛 语言 和 训练 平台 


ICPC 允许 的 算法 竞赛 用 的 编程 语言 有 C.C++ 、Java、Python、Kotlin? 几 种 。 其 中 C++ 因 运 
行 效率 高 .具有 丰富 的 STL 函数 库 , 最 受 竞 赛 队 员 欢 迎 。Java 和 Python 也 比较 常用 ,它们 在 
处 理 大 数据 时 极为 简便 ,这 几 年 Python 上 升 的 势头 很 快 。 这 几 种 编程 语言 ,在 就 业 市 场 上 都 
有 大 量 的 岗位 需求 , 极 容易 就 业 。 熟 练 掌握 一 种 编程 语言 是 基本 的 ,掌握 几 种 语言 是 必要 的 。 

竞赛 队员 主要 的 学 习 方 法 就 是 “ 刷 题 ”, 在 Online Judge(OJ ,在 线 判 题 网 回 革 点 回 
站 ) 上 大 量 做 编程 题 。OJ 上 有 丰富 的 编程 题目 ,能 对 编程 者 提交 的 程序 进行 
自动 判 题 ,返回 “正确 ”或 “错误 ”提示 。 国 内 、 国 外 有 很 多 OJ, 国 内 的 例如 
acm. hdu. edu. cn、poj. org, 国 外 的 例如 uva、ural、usaco 等 。0OJ 的 核心 价值 Fe 
主要 有 两 个 , 即 题目 和 判 题 用 的 测试 数据 。 测 试 数据 的 重要 性 不 亚 于 题目 本 ”视频 讲解 
身 , 甚 至 更 重要 。 

很 多 队员 在 高 中 接触 了 NOI 信息 学 竞赛 ,他 们 常常 在 CCF 的 OJ@ ,以 及 * 洛 谷 ” 和 * 大 
视野 @" 几 个 网 站 做 题 , 以 中 文 题 为 主 。 其 中 , 洛 谷 试 炼 场 @" 的 题目 分 类 比较 全 ,是 很 好 的 
基础 学 习 平台 。 

在 这 些 OJ 之 外 还 有 一 些 代理 Judge。 这 些 代 理 以 http 的 方式 调用 了 宿主 OJ 提供 的 
判 题 服务 ,连接 了 30 多 个 著名 的 OJ ,相当 于 一 个 综合 平台 。 代 理 Judge 的 优点 如 下 : 

(1) 方便 做 国外 题目 ,因为 在 国内 直接 连接 外 国 的 uva 等 OJ 往往 极 慢 , 而 通过 代理 很 快 。 

(2) 如 果 某 个 OJ 网 站 直接 连 不 上 ,在 代理 上 也 常常 能 做 这 些 OJ 的 题目 。 

(3) 虚拟 比赛 功能 , 即 把 来 自 不 同 宿主 OJ 的 题目 混 编 为 一 场 训练 赛 ,特别 方便 日 常 训练 ©。 

搭建 OJ 系统 在 技术 上 是 不 难 的 。 事实 上 ,几乎 所 有 常年 开展 算法 竞赛 的 学 校 都 建立 
了 自己 的 OJ, 用 于 训练 和 比赛 。 


1.3.2” 判 题 和 基本 的 输入 与 输出 
在 OJ 提交 程序 后 ,OJ 如 何 判断 程序 是 正确 的 还 是 错误 的 ? 


https: / /icpe. baylor. edu/ worldfinals/ programming-environment( 短 网 址 : t. cn/Rx4xYSH) 
参考 cn. vjudge. net 列 出 的 OJ 网 站 。 

全 国 青 少年 信息 学 奥林匹克 竞赛 网 站 : www. noi. cn; 做 题 网 站 : oj. noi. cn。 

大 视野 OJ: www. lydsy. com, 网 上 简称 bzoj。 

洛 谷 试 炼 场 : https://www. luogu. org/training/mainpage, 有 不 错 的 分 类 。 

专题 学 习 : kuangbin 带 你 飞 ,vjudge. net/article/187。 


@@eeee 
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OJ 由 计算 机 自动 判 题 ,但 计算 机 并 没有 看 懂 代 码 的 智能 ; 即使 是 人 工 判 题 , 人 也 很 难 
在 短 时 间 内 看 懂 程 序 。 因 此 ,OJ 判 题 是 一 种 黑 盒 测 试 , 它 并 不 关心 程序 的 内 容 , 而 是 用 测试 

OJ 的 后 台 存储 了 每 个 题目 的 测试 数据 ,有 输入 数据 和 对 应 的 输出 数据 ,并 且 有 很 多 组 
输入 和 输出 数据 。OJ 运行 用 户 提 交 的 程序 后 读 取 输 入 数据 ,程序 产生 输出 ,然后 与 后 台 的 
标准 输出 进行 对 比 ,可 以 得 到 以 下 结果 之 一 ?: 

(1) 没有 超时 ,并 且 完 全 一 致 ,判定 Accepted (AC)。 

(2) 超时 ,判定 Time Limit Exceeded (TLE)。 在 一 般 情 况 下 ,返回 TLE 说 明 方法 错 
误 ,整个 程序 可 能 需要 推倒 重 来 。 

(3) 结果 是 对 的 ,但 是 格式 有 错误 ,例如 多 了 空格 ,返回 Presentation Error (PE) 。 
(4) 结果 错误 ,或 者 有 其 他 问题 ,返回 WA 、RE、MLE 等 信息 。 
于 OJ 不 看 程序 内 容 , 只 关心 程序 的 输入 和 输出 ,所 以 在 程序 中 不 写 详细 过 程 ,而 是 
用 printfO 〇 或 cout 直接 打印 结果 ,这 也 是 允许 的 ,这 种 方法 叫 “ 打 表 ”。 另 外 ,程序 可 能 需要 
预 处 理 数据 ,这 个 做 法 也 称 为 “ 打 表 ”。 

一 个 题目 的 测试 数据 可 能 有 成 千 上 万 组 。 好 的 测试 数据 应 该 尽量 覆盖 所 有 可 能 的 情 
况 , 而 不 好 的 测试 数据 会 让 题目 失去 价值 ,这 就 是 为 什么 测试 数据 和 题目 本 身 一 样 重要 的 
原因 。 

1. 输入 与 输出 函数 

C++ 语言 中 的 标准 输入 语句 为 cin ,输出 语句 为 cout@ 。 

C 语言 中 的 输入 与 输出 函数 如 下 。 

。 putchar() : 把 一 个 字符 常量 输出 到 显示 器 屏幕 上 ; 

。 getchar(): 从 键盘 上 输入 一 个 字符 常量 ; 
printf(): 把 数据 按 格式 控制 输出 到 显示 器 屏幕 上 ; 
scanf() : 从 键盘 上 输入 各 类 数据 ; 
。 pnuts(): 把 一 个 字符 串 常量 输出 到 显示 器 屏幕 上 ， 
gets(): 从 键盘 上 输入 一 个 字符 串 常量 ; 

。 sscanf() : 从 一 个 字符 串 中 提取 各 类 数据 。 

在 竞赛 中 ,默认 使 用 标准 输入 stdin 和 标准 输出 stdout ,所 以 在 提交 程序 时 并 不 用 管 OJ 
是 怎么 进行 数据 测试 的 。 如 果 用 到 文件 的 输入 与 输出 ,会 特别 说 明 使 用 方法 。 

2. 输入 结束 方式 

(1) 默认 结束 。 在 OJ 上 一 般 有 多 组 测试 数据 ,如 果 没 有 明确 指出 输入 在 什么 时 候 结 
东 , 则 程序 以 “文件 结束 ”EOF) 为 结束 标志 。 例 如 : 


int main(){ 
int a,b; // 输 入 ab 


四 http://acm. hdu. edu. cn/faq. php。 
回 在 Competitive Programmer's Handbook( 作 者 Antti Laaksonen,2017 年 10 月 11 日 ) 的 第 1 章 中 介绍 了 编程 语 
言 的 一 些 注意 事项 。 
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while(scanf("%ds%d",&a, gb) != EOF){  // 等 价 于 while(~scanf("%d%d", &a, &b)){ 


return 0; 


一 些 队员 喜欢 把 输入 语句 写成 : 
while( 一 scanf("% dg d"，8a，&b)) 


这 也 是 对 的 。 因 为 如 果 没 有 输入 ,scanf() 返 回 EOF, 系 统 定义 EOF = 一 1, 取 非 就 
是 0。 

在 竞赛 时 ,一般 不 建议 用 判断 EOF 的 方法 。 本 书 的 程序 采用 while (~scanf("%d%d"， 
&a，&b)) 形 式 。 

(2) 在 输入 数据 中 指定 了 数据 个 数 。 一 般 在 输入 数据 的 第 1 行 定 义 数据 量 大 小 ,例如 
第 1 行 是 100, 则 表示 有 100 组 数据 。 这 里 以 hdu 1090 题 为 例 ,程序 如 下 : 


hdu 1090 题 程序 


int main(){ 


int n, a, b; 
scanf("%d", gn); //n: 有 多 少 组 数据 
while(n—— ){ 


scanf("%d %d", &a, &b); 
printf("% d\n", a + b); 
} 
return 0; 


(3) 以 特定 元 素 作 为 结束 符 。 例 如 以 0 作为 结束 符 , 当 输入 读 到 0 时 就 退出 ,可 以 这 
样 写 : 


while(~scanf("%d",gn) && n) 


3. 输入 与 输出 的 效率 

在 C++ 语言 中 ,输入 和 输出 常用 的 语句 是 cin、cout, 优 点 是 很 方便 。 但 是 用 户 需 要 注 
意 , 与 scanf()、printf() 相 比 ,cin、cout 的 效率 很 低 ,速度 很 慢 。 如 果 题 目 中 有 大 量 的 测试 数 
据 ,由 于 cin .cout 输入 和 输出 慢 , 可 能 导致 TLE, 在 这 种 情况 下 应 使 用 scanf() .printf() 。 

例如 hdu 3233 题 。 在 本 例 中 输入 1 委 T 委 20 000, 可 能 有 20 000 行 数据 ,因此 输入 的 效 
率 很 关键 。 此 题 用 scanf() .printf(C) 可 以 AC,OJ 返回 的 执行 时 间 是 140ms; 用 cin ,cout , 结 
果 TLE, 执 行 时 间 超 过 1000ms。 


hdu 3233 程序 : 用 scanf() .printf() ,AC, 执 行 时 间 是 140ms 


#include < bits/stdc++.h> 

int main(){ 
on = 1 
while(scanf("%d$%d%d", &T, gn, &B)){ 
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if(T==0 || n==0 || B== 0) break; 

double s, p, sum = 0; 

while(T-- ) { //1<T<20000 
scanf(" %1f%1f", &, gp); // 高 效率 输入 
sum += sx (100—p)*0.01; 

} 

printf("Case %d: %.2f\n\n", cntt+, sum/(B*1.0)); 

} 


return 0; 


hdu 3233 程序 : 用 cin 和 cout, 结 果 TLE, 执 行 时 间 超 过 1000ms 


#include<bits/stdc+t+.h> 
using namespace std; 
int main(){ 
了 nent = 1, By 
while(cin > T> n>> B){ 
if(T==0 || n==0 || B== 0) break; 
double s, p, sum = 0; 
while(T-- ) { //1<T<20000 
cin >>s >>p; // 输 入 很 慢 
sum += sx* (100—-p)*0.01; 
} 
cout << "Case " << cnt++ << ": " << fixed << setprecision(2) 
<< sum/(B* 1.0) << endl << endl; 
} 


return 0; 


1.3.3 测试 


1. 构造 测试 数据 

在 程序 编 好 之 后 应 该 自己 先 测 试 通过 ,再 提交 到 系统 ,而 题目 给 的 样 例 数据 一 般 都 太 
少 , 不 足以 检验 程序 的 正确 性 ,队员 需要 自己 构造 测试 数据 。 

在 一 个 队伍 中 ,一 般 安排 一 个 队员 专门 负责 构造 测试 数据 。 对 于 需要 高 级 算法 的 题目 ， 
可 以 让 这 名 队员 先 用 暴力 法 编程 ,然后 随机 生成 输入 数据 ,运行 暴力 程序 ,生成 输出 数据 。 
输入 数据 除了 随机 生成 以 外 ,有 时 候 还 需要 手工 生成 一 些 , 主 要 是 边界 数据 、 特 别 小 的 数据 、 
特别 大 的 数据 等 ,这 些 也 是 最 容易 出 错 的 。 

为 方便 操作 ,可 以 把 构造 出 的 输入 数据 放 在 文件 test. in 里 ,将 程序 的 结果 输出 到 文件 
test. out 里 。 当 然 , 有 时 候 不 需要 输出 文件 test. out ,直接 在 屏幕 上 看 输出 结果 就 可 以 了 。 

那么 如 何方 便 地 使 用 它们 ?有 以 下 两 种 方法 : 

(1) 在 程序 中 加 入 测试 代码 。 


# define mytest 
# ifdef mytest 
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freopen("test. in", "r", stdin); 
freopen( "test. out", "w", stdout); 
#endif 


在 提交 时 ,去 掉 # define mytest 即 可 。 

(2) 在 行 命令 中 重 定向 。 

这 是 更 简单 的 方法 ,不 用 在 程序 中 加 任何 代码 。 例 如 ,生成 的 可 执行 程序 是 abc, 在 
Windows 或 Linux 的 行 命令 中 这 样 输入 和 输出 到 文件 : 


abc < test. in > test. out 


2. 对 比 测试 数据 

对 于 复杂 的 题目 ,可 能 需要 写 两 个 程序 : 一 个 是 提交 到 OJ 的 “好 ”程序 ; 
另 一 个 是 暴力 法 程序 ,目的 是 用 它 生成 测试 数据 。 这 种 方法 称 为 “对 拍 ”。 Ls 

在 测试 的 时 候 ,可 以 用 行 命令 比较 两 个 程序 的 输出 是 否 一 致 。 例 如 在 “ 回 蛙 
Windows 系统 下 ,生成 的 可 执行 文件 分 别 是 abc. exe、abc_1. exe, 用 文件 比较 
命令 fc 比较 它们 的 输出 是 否 一 致 。 

abc, exe < test, in > test1l, out 


abc_1.exe < test. in > test2. out 
fc test1. out test2. out /n 


在 Linux 系统 中 ,文件 比较 命令 是 diff。 
1.3.4 编码 速度 


竞赛 时 间 很 紧张 ,编码 应 该 简洁 。 跟 软件 工程 的 代码 相 比 ,竞赛 题 的 代码 都 不 长 ,从 几 
行 到 200 多 行 。 快 速 编程 得 到 正确 结果 即 可 ,无须 担心 程序 是 否 符合 工程 项 目的 要 求 , 也 不 
要 求 写 得 多 么 “漂亮 ”, 这 是 竞赛 中 编码 的 特点 。 

编程 速度 决定 了 参赛 获奖 的 级 别 。 在 一 般 情况 下 ,同样 的 出 题 数 量 会 跨越 相 邻 的 获奖 
等 级 ,例如 同样 做 5 道 题 , 排 前 面 的 获 银牌 , 排 后 面 的 获 铜牌 。 但 是 ,如 果 跨 越 的 等 级 过 大 ， 
则 是 不 正常 的 。 近 些 年 来 ,由 于 区 域 赛 的 出 题 质量 参差 不 齐 ,“ 速 度 ” 这 个 因素 的 影响 越 来 越 
大 。 一 套 理想 的 题目 应 该 有 很 好 的 区 分 度 ,例如 金牌 8 题 以 上 ,银牌 6 题 以 上 ,铜牌 4 题 以 
上 。 但 是 近年 来 常常 遇 到 这 样 的 赛区 : 终 榜 时 ,做 题 数量 一 样 ,只 是 因为 出 题 快 慢 不 同 ,名 
次 就 从 银牌 到 铜牌 再 到 铁 牌 ( 铁 牌 是 honorable mention, 即 鼓励 奖 的 玩笑 说 法 ), 分 成 了 
3 个 等 级 。 应 该 说 ,这 样 大 的 跨越 度 不 能 区 分 参赛 队伍 的 水 平 。 

那么 如 何 提高 编码 速度 ? 

(1) 读 题 要 快 。 题 目 都 是 英文 的 ,新 队员 往往 不 习惯 ,需要 长 期 训练 才能 适应 。 虽 然 有 
些小 窍门 ,例如 先 读 样 例 ,再 读 题 面 内 容 , 但 最 根本 的 还 是 靠 大 量 的 英语 阅读 练习 ,学 会 在 脑 
海中 直接 用 英语 进行 思考 ,才能 提高 读 题 速 度 。 一 套 题 需要 3 个 队员 分 工 快速 读 完 ,每 个 人 
读 完 后 必须 和 队员 一 起 讨论 ,确定 完全 理解 题 意 。 在 竞赛 现场 紧张 的 气氛 下 ,一 个 队员 不 要 
太 相信 自己 ,而 忽视 了 队友 的 帮助 。 

(2) 熟练 掌握 编辑 器 或 IDE。 根 据 规定 ,现场 赛 提供 的 编辑 器 有 vim、gedit 等 ,IDE 有 
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Eclipse、Code: :Blocks 等 0。Eclipse 和 Code: :Blocks 受到 新 手 和 很 多 老 队 员 的 欢迎 ,不 过 
一 些 老 队员 说 ,熟练 使 用 编辑 器 vim 写 代码 速度 更 快 。 在 竞赛 中 ,能 赢得 几 分 钟 的 领先 时 
间 有 时 是 很 关键 的 。 据 说 ,参加 世界 总 决赛 的 队员 使 用 vim 的 比例 很 高 。 

(3) 不 要 “霸占 ”计算 机 。 由 于 竞赛 时 是 三 人 一 机 ,只 能 有 一 人 使 用 键盘 输入 代码 ,另外 
两 人 在 旁边 手写 代码 ,等 计算 机 空闲 了 再 使 用 。 在 平时 训练 时 应 该 养 成 事先 在 纸 上 写 好 代 
码 的 习惯 ,不 能 边 裔 键盘 边 思考 ,否则 会 浪费 机 时 。 

(4) 减少 调试 。 因 为 机 时 非常 宝贵 ,所 以 除 必要 的 代码 输入 和 测试 外 尽量 少 使 用 计算 
机 。 在 写 好 程序 后 ,争取 能 一 次 通过 测试 样 例 。 

为 了 减少 调试 ,尽量 使 用 不 容易 出 错 的 方法 ,例如 少 用 指针 、 使 用 静态 数组 .把 迎 辑 功能 

另外 ,不 要 使 用 动态 调试 方法 ,不 要 用 单 步 跟踪 、 断 点 等 调试 工具 。 如 果 需 要 查看 中 间 
数据 ,可 用 cout() 或 printf() 打 印 出 调试 信息 。 

如 果 程 序 有 问题 ,不 要 在 计算 机 上 检查 ,应 该 打印 出 来 坐 在 旁边 看 ,把 机 时 让 给 队友 。 

(5) 互相 检查 。 把 代码 讲 给 队友 听 是 查 错 的 好 办 法 ,即使 队友 不 能 理解 你 的 思路 ,你 在 
讲解 的 过 程 中 也 往往 能 突然 发 现 自 己 的 问题 。 

(6) 使 用 STL。 如 果 题 目 涉及 比较 复杂 的 数据 处 理 , 或 者 像 sort() 这 样 需要 灵活 排序 
的 函数 ,用 STL 可 以 大 大 减少 编码 量 , 并 减少 错误 的 发 生 。 例 如 第 10 章 的 最 短路 径 算 法 
Dijkstra, 需 要 对 结 点 进行 松弛 处 理 ,自己 编程 实现 会 很 烦琐 ,而 如 果 直 接 使 用 STL 的 优先 
队列 ,编码 能 极 大 简化 。 

(7) 一 些 编码 小 技巧 。 例 如 把 长 字符 重新 定义 成 短 字符 ,可 以 节省 一 点 时 间 


typedef long long 11; 
那么 

long longa = 1234567890; 
变 成 了 简洁 的 : 


lla = 1234567890; 


1.3.5 模板 


使 用 模板 对 提高 编码 速度 很 有 帮助 。 

刚 参 加 算法 竞赛 学 习 的 队员 都 听 说 有 一 种 叫 * 模 板 "的 神器 。 模 板 是 参赛 选手 认为 有 用 
的 代码 片段 ,将 其 打印 出 来 ,允许 带 进 竞赛 现场 作为 “小 抄 ”"。 在 网 上 能 找到 很 多 老 队员 的 模 
板 , 它 们 是 学 习 编码 的 好 的 参考 。 

听 起 来 “模板 ”是 非常 有 用 的 : 竞赛 涉及 几 百 种 数据 结构 和 算法 知识 ,如 果 把 它们 的 经 
典 代码 都 总 结 出 来 ,在 做 题 的 时 候 直接 拿 来 用 不 就 行 了 吗 ? 这 不 就 是 软件 工程 的 “模块 
化 ? 吗 ? 


https://icpe. baylor. edu/worldfinals/programming-environment, 规 定 了 编程 环境 ( 短 网 址 : t. cn/Rx4xYSH) 。 
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现实 也 证 明了 这 一 点 : 有 些 赛 区 确实 会 出 一 些 “ 模 板 题 ", 模 板 上 的 程序 模块 真 的 能 直 
接应 用 在 竞赛 题 中 。 

模板 非常 有 用 ,其 重要 性 主要 在 于 帮助 参赛 选手 理解 经 典 算法 ,而 不 一 定 能 用 在 赛场 上 。 

使 用 模板 需要 考虑 以 下 问题 : 

(1) 模板 题 并 不 常见 。 一 个 负责 任 的 现场 赛会 避免 出 模板 题 ,所 有 的 题目 都 不 能 直接 
抄 模板 。 

(2) 抄 模板 的 能 力 。 即 使 有 模板 ,就 一 定 会 抄 吗 ? 模板 的 代码 需要 自己 真正 理解 ,并 多 
次 使 用 过 ,这 样 才能 在 做 题 的 时 候 快 速 应 用 到 编码 中 。 不 同 的 编程 题目 ,即使 用 到 相同 的 算 
法 或 数据 结构 ,也 往往 不 能 用 同样 的 代码 ,而 需要 做 很 多 修改 ,因为 不 同 环境 下 的 变量 和 数 
据 规 模 是 不 同 的 。 因 此 ,对 模板 的 学 习 和 使 用 需要 花 时 间 融 会 贯通 ,不 能 急躁 。 期 望 靠 模板 
速成 ,急于 拿 去 参赛 获奖 是 没 用 的 。 

(3) 综合 模板 的 能 力 。 即 使 能 用 到 模板 ,但 是 题目 往往 需要 综合 几 个 算法 、 逻 辑 、 数 据 
结构 等 ,如 何 把 模板 融入 整体 代码 中 是 很 考验 参赛 选手 能 力 的 。 如 果 只 会 用 模板 而 没有 理 
解 模板 ,就 像 把 尺寸 不 匹配 的 齿轮 揭 在 一 起 ,根本 转 不 起 来 。 

(4) 最 重要 的 一 点 是 建 模 能 力 。 一 个 好 题目 符合 这 样 的 特征 : 题目 很 清晰 ,问题 很 清 
楚 ,然而 很 难 想 出 它 是 什么 算法 .能 用 什么 模板 。 但 是 ,如 果 有 人 直接 告诉 你 它 其 实 是 什么 
算法 ,可 以 用 什么 模板 ,你 会 憾 然 大 悟 ,很 快 就 能 做 出 来 。 这 个 能 力 就 是 建 模 能 力 。 真 正 的 
学 习 是 掌握 算法 后 面 的 思想 ,而 不 是 只 会 背 算法 。 通 常 有 这 样 的 比喻 : 若 只 会 使 用 算法 的 
模板 而 没有 深入 掌握 算法 的 思想 , 则 这 个 模板 相当 于 残疾 人 的 假肢 ,看 起 来 像 是 自己 的 , 走 
起 来 就 知道 不 是 自己 的 。 只 有 把 算法 的 思想 深 深 根植 于 脑海 , 才 会 使 其 成 为 身体 的 一 部 分 ， 
达到 心 手 一 致 的 境界 。 从 这 个 角度 出 发 也 能 理解 “ 质 二 量 ”, 在 学 习 时 不 要 追求 学 到 的 算法 
的 “数量 ”, 而 是 要 掌握 其 “思想 ”。 很 多 算法 的 思想 其 实 是 相通 的 。 

本 书 所 讲解 的 程序 代码 都 经 过 了 精心 准备 ,是 经 典 代码 ,大 部 分 可 以 当 模板 学 习 。 

每 个 队员 都 需要 总 结 自己 的 模板 。 在 比赛 时 带 到 赛场 上 ,也许 真 的 会 遇 到 模板 题 呢 ! 

提高 编程 速度 ,最 根本 的 还 是 要 通过 大 量 练习 ,提高 编码 的 熟练 程度 “无 他 ,但 手 
熟 尔 !” 


1.3.6 题目 分 类 


算法 竞赛 涉及 很 多 方面 的 知识 ,可 以 粗略 地 进行 以 下 分 类 人?. 

。 Ad Hoc, 杂 题 ; 

。 Complete Search (Iterative/Recursive) , 穷 举 搜索 (迭代 /回溯 ); 
。 Divide and Conquer, 分 治 法 ; 

。 Greedy (usually the original ones) ,贪心 法 ; 

。 Dynamic Programming (usually the original ones) ,动态 规划 ; 
。 Graph, 图 论 ; 

。 Mathematics ,数学 ; 


中 在 (Competitive Programming 3)( 作 者 Steven Halim、Felix Halim) 的 “1. 2. 2 Quickly Identify Problem Types” 
中 。 另 外 ,在 “1.4 The Ad Hoc Problems" 中 列 出 了 大 量 杂 题 ,读者 可 以 做 一 做 。 
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。 String Processing ,字符 串 处 理 ; 

。 Computational Geometry ,计算 几 何 ; 

。 Some Harder/Rare Problems ,罕见 问题 。 

除 杂 题 外 ,其 他 分 类 都 与 数据 结构 和 算法 有 关 。 

杂 题 也 很 常见 ,每 次 现场 赛 都 会 有 1 道 或 2 道 题 。 虽 然 程序 设计 竞赛 的 重点 在 算法 方 
面 ,但 是 竞赛 时 有 些 题 只 考查 逻辑 能 力 和 编码 能 力 , 并 不 涉及 数据 结构 或 算法 ,只 要 学 过 基 
本 C++ 语法 就 能 做 。 这 样 的 题目 可 能 很 难 。 作 为 练习 ,读者 可 以 尝试 下 面 的 题目 ,它们 都 是 
大 型 模拟 题 ,以 烦琐 、 坑 人 著称 ,代码 超过 200 行 , 需 要 很 大 的 耐心 和 细心 : 

。 bzoj 19729“ 猪 国 杀 ”; 

。 bzoj 1033“ 杀 蚂蚁 ”; 

。 bzoj 2548“ 灭 鼠 行动 ”。 

本 书 内 容 包 括 杂 题 以 外 的 所 有 分 类 ,在 每 个 分 类 中 均 会 讲解 常用 的 知识 点 。 


1.3.7 ”代码 规范 


虽然 说 每 个 程序 员 都 可 以 有 自己 的 编码 风格 ,但 是 还 需要 遵循 大 家 公认 的 一 些 规范 ,以 
便于 和 队友 互相 交流 。 

下 面 列 出 了 一 些 常 见 的 注意 事项 。 

(1) header。 使 用 万 能 头 文件 “#include < bits/stdc 十 十 .h >”,OJ 网 站 一 般 都 支持 ,一 
个 例外 是 poj, 它 不 支持 。 

另外 ,不 要 用 C 风格 的 header, 例 如 #include < stdio. h >。 

(2) 输入 判断 结尾 不 要 用 EOF ,而 用 ' 一 …, 例 如 : 

~scanf("%d", gn) 

在 1.3.2 节 中 已 经 详细 介绍 了 这 个 问题 。 

(3) 换行 。 用 K&R 风格 , 即 左 大 括号 不 换行 , 右 大 括号 单列 一 行 。 

(4) 变量 定义 。 变 量 定义 在 这 个 变量 被 调用 的 最 近 的 地 方 ,例如 : 

for (int i = 0; i<10; it+) { /让 只 在 这 个 循环 体内 使 用 
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} 

(5) 最 好 不 要 用 宏 。 不 管 是 宏 定 义 还 是 宏 函 数 , 都 容易 出 问题 。 
不 要 用 #define 定义 常量 ,而 用 const 定义 常量 ,例如 : 

const int MAX = 1000005; 


(6) 参考 资料 。 
Google C++ 规范 : https://google. github. io/styleguide/cppguide. html。 


Linux C 规范 : https://www. kernel. org/doc/html/v4. 10/process/coding-style. html。 


@ https://www. lydsy. com/JudgeOnline/problem. php?id 一 1972( 短 网 址 : t. cn/RgCalSi) 。 
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1.4 天 赋 与 勤奋 


世上 是 否 存在 编程 天 才 ? 答案 是 肯定 的 。 普 通 智 力 能 和 否 达到 很 高 的 编程 水 平 ? 答案 也 
是 肯定 的 。 人 们 常 说 的 “天 赋 决 定 上 限 ,努力 决定 下 限 ”, 在 编程 竞赛 这 种 高 智力 活动 上 有 一 
定 的 道理 。 

天 赋 , 在 成 功 的 因素 中 占有 很 大 的 比重 。 如 果 要 达到 顶级 水 平 ,天赋 就 更 重要 了 。 例 如 
在 体育 运动 项 目 中 ,能 达到 获得 奥运 奖牌 水 平 的 运动 员 , 他 的 天 赋 几 乎 有 决定 性 的 影响 。 在 
脑力 活动 中 ,类 似 编 程 这 样 繁杂 而 高 深 的 思维 活动 ,智力 的 因素 非常 大 。 

如 果 读 者 有 兴趣 ,可 以 用 五 子 棋 或 魔方 检验 自己 在 记忆 力 、 罗 辑 推理 .空间 想象 力 .专注 
度 .敏捷 性 等 方面 的 智力 天 赋 。 这 两 种 游戏 的 特点 是 规则 简单 、 上 手 快 .变化 比较 复杂 。 所 
有 人 都 能 玩 , 但 是 想 玩 好 ,大 部 分 人 需要 一 段 比较 长 的 学 习 时 间 。 一 个 初学 者 ,如 果 只 需要 
几 天 的 学 习 就 能 达到 很 高 的 水 平 , 那 么 差不多 可 以 说 他 拥有 编程 天 赋 了 2®。 

这 些 有 编程 天 赋 的 少数 人 ,如 果 能 专注 练习 ,他 们 的 学 习 效 率 要 比 普通 人 高 出 几 倍 ,更 
容易 成 功 。 如 果 他 们 在 刚 上 大 学 的 时 候 从 零 基础 开始 学 习 编 程 ,那么 他 们 在 大 三 甚至 大 二 
就 能 获得 银牌 ,在 大 四 或 者 大 三 就 能 获得 金牌 ,可 称 为 天 之 骄子 ! 

智力 普通 的 学 生 ,通过 勤奋 的 学 习 , 挖 掘 出 自己 的 智商 潜力 、 锻 炼 自己 的 专业 技能 ,也 能 
达到 很 高 的 水 平 。 特 别 是 对 于 编程 这 种 需要 掌握 海量 知识 、 拥 有 长 期 编码 经 验 的 高 智力 活 
动 来 说 ,勤奋 相对 天 赋 的 比重 在 职业 生涯 中 会 越 来 越 大 。 根 据 经 验 ,参加 ICPC 竞赛 的 学 
生 , 即 使 是 零 起 点 ,如 果 能 在 大 一 人 学 后 坚持 每 天 2 一 4 个 小 时 的 编程 学 习 , 那 么 他 完全 可 以 
在 大 三 的 第 一 学 期 参加 区 域 赛 并 获得 铜牌 ,甚至 银牌 金牌 。 

学 习 编 程 需要 做 好 艰苦 学 习 的 心理 准备 。 编 程 是 一 个 长 期 艰苦 的 过 程 , 有 乐趣 ,更 有 
挫折 。 

在 标题 为 “Why Learning to Code is So Damn Hard” 的 网 页 中 8 对 学 习 编 程 的 不 同 阶段 
给 出 了 一 个 有 趣 的 图 ,如 图 1.1 所 示 。 

该 图 把 编程 分 成 4 个 阶段 , 横 坐 标 是 编码 能 力 , 纵 坐标 是 信心 。 

第 1 阶段 (hand-holding honeymoon) : 手把手 关怀 的 蜜月 期 ,能 力 和 信心 同步 增长 。 初 
学 者 充满 了 乐趣 ,很 有 成 就 感 ,能 找到 丰富 的 学 习 资料 。 

第 2 阶段 (cliff of confusion) : 充满 迷惑 的 下 滑 期 。 虽 然 编程 者 的 实际 能 力 在 上 升 ,但 
却 逐 渐 形 失 了 信心 。 这 是 因为 遇 到 了 难以 解决 的 问题 .需要 调试 大 量 bug、 遇 到 挫败 。 不 过 
这 个 时 候 仍 能 够 找到 答案 ,知识 面 也 在 变 广 。 

第 3 阶段 (desert of despair) : 绝望 的 迷茫 期 ,信心 的 沙漠 。 编 程 者 遇 到 更 加 困难 的 问 
题 ,需要 的 知识 剧 增 , 但 是 资源 匮乏 ,在 网 上 也 找 不 到 答 案 , 或 者 不 知道 该 怎么 提问 ,感觉 就 


@ 一 节 课 领悟 五 子 棋 ; www. zhihu. com/question/265407029/answer/299115371( 永 久 网 址 : perma. cc/uz27- 
BXKT) 。 

回 ”天 才女 程序 员 : www. zhihu. com/question/29784784( 永 久 网 址 : perma. cc/XS4R-45ZS) 。 

® www. vikingcodeschool. com/posts/why-learning-to-code-is-so-damn-hard( 永 久 网 址 : perma. cc/BK4R-WS7F) 
这 条 曲线 和 Dunning-kruger effect 的 曲线 很 相似 ,与 “ 认 知 偏差 有关 。 
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Coding Confidence vs Competence 


1 hand-holding 
honeymoon 


Job Ready 


1 cliff of 
| confusion 1 


desert of 
1despair 


Confidence 


1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 


Competence 
1.1 编码 能 力 与 信心 的 关系 


像 在 沙漠 一 样 。 

第 4 阶段 (upswing of awesome) : 前 歼 的 上 升 期 。 编 程 者 心潮 澎 浒 ,浑身 充 满 力量 , 绝 
望 的 沙漠 已 经 过 去 。 

简单 地 说 ,ICPC 区 域 赛 铜牌 水 平 的 选手 可 能 还 未 到 达 第 4 阶段 ; 银牌 以 上 水 平 的 选 
手 , 可 以 确定 到 达 了 第 4 阶段 ,从 而 跨 过 了 自由 编程 的 门槛 。 

本 书 的 内 容 ,在 这 个 图 中 估计 只 涉及 整个 阶段 的 前 30%, 即 前 两 个 部 分 ,也 就 是 hand- 
holding honeymoon 和 cliff of confusion, 相 当 于 入 门 和 进 阶 。 能 否 进入 后 两 个 阶段 ,取决 于 
读者 自己 的 努力 。 


1.5 学 习 建 议 


很 多 大 学 生 在 中 学 阶段 就 参加 过 NOI 信息 学 竞赛 ,或 者 学 习 过 编程 ,那么 他 们 已 经 有 
了 基础 ,进入 大 学 后 又 投入 了 更 多 时 间 专 心地 进行 编程 训练 .有 这 么 好 的 起 点 当然 是 很 有 优 
势 的 。 

如 果 是 完全 的 零 基 础 ,也 不 用 担心 自己 落后 。 因 为 相 比 已 经 有 了 基础 的 同学 只 是 晚 学 
了 几 个 月 而 已 ,只 要 多 花 一 些 时 间 ,很 快 就 能 赶 上 。 对 于 算法 竞赛 这 样 需要 两 三 年 的 长 周期 
学 习 来 说 ,坚持 才 是 最 重要 的 。 

由 于 算法 竞赛 的 艰难 和 长 期 性 ,不 管 有 没有 基础 ,都 应 该 从 大 一 上 学 期 开始 学 习 。 

(1) 大 一 上 学 期 ,熟悉 C、.C++ .Java 语言。 一 些 专业 在 大 一 上 学 期 开设 编程 语言 课 ; 大 
部 分 专业 是 在 大 一 下 学 期 ,这 些 学 生 需 要 自学 编程 语言 。 

(2) 大 一 上 学 期 ,做 一 些 简单 的 中 文 题 ,例如 acm. hdu. edu. cn 的 2000 一 2099 题 ?、 洛 
谷 试 炼 场 。 任 务 是 进一步 熟悉 编程 语言 ,学习 如 何在 OJ 上 做 题 .掌握 输入 与 输出 的 用 法 、 


http://acm. hdu. edu. cn/listproblem. php?vol 王 11, 大 部 分 比较 简单 ,也 有 难题 ,可 以 跳 过 。 
。14 。 
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积累 代码 量 。 基 本 上 每 个 题目 在 网 上 都 能 搜 到 题解 和 代码 。 初 学 者 可 以 多 看 看 别人 的 代 
码 , 尽 快 提高 自己 的 编码 能 力 。 另 外 .最 好 几 个 人 一 起 编程 ,并 互相 改 错 。 看 懂 别 人 的 代码 ， 
找 出 别人 代码 的 错误 ,也 是 很 好 的 训练 ,重要 性 不 亚 于 独立 做 题 。 

(3) 大 一 下 学 期 ,做 一 些 入 门 题 ,例如 搜索 、 数 学、 贪心 .简单 动态 规划 等 , 尽 可 能 多 地 参 
加 各 校 举 办 的 新 生 网 络 赛 。 

(4) 大 一 暑假 ,参加 集训 ,学 习 数 据 结 构 、 深 入 掌握 STL、 进 行 各 种 专题 人 门 , 并 熟悉 
队友 。 

(5) 大 二 ,深入 各 类 专题 学 习 , 并 制定 一 年 的 计划 ,牢固 掌握 各 种 算法 知识 点 。 如 有 可 
能 ,在 大 二 上 学 期 参加 区 域 赛 。 

(6) 大 二 暑假 ,组 队 参 加 网 络 赛 和 模拟 赛 。 

(7) 大 三 上 学 期 ,参加 区 域 赛 并 获奖 。 

(8) 大 三 和 大 四 ,开始 难题 ,综合 题 的 学 习 , 使 自己 获得 彻底 的 飞越 ,成 为 “编码 大 师 ”。 
通常 ,能 获得 金牌 的 队伍 至 少 能 做 出 1 个 以 上 的 难题 。 难 题 有 3 个 特征 , 即 综 合 性 强 、 思 维 
复杂 ,代码 元 长 。 这 些 难 题 是 绝 大 部 分 学 编程 的 学 生 难 以 翻越 的 大 山 ,能 征服 大 山 的 竞赛 队 
员 可 以 称 为 “杰出” 了。 


1.6 本 书 的 特点 


参加 竞赛 训练 的 队员 需要 阅读 各 种 各 样 的 算法 书 、 编 程 书 。 本 书 作者 不 奢望 写 出 一 本 
面面俱到 ,老少 咸 宜 的 书 , 而 且 这 样 的 书 也 许 并 不 存在 。 本 书面 向 的 读者 是 初学 者 和 中 级 进 
阶 者 ,特点 如 下 : 

(1) 算法 知识 点 的 讲解 清晰 、 易 懂 。 在 众多 确定 的 算法 中 ,少数 算法 比较 简单 ,多 数 比 
较 难 。 通 俗 易 懂 地 讲解 一 个 复杂 的 算法 是 不 容易 的 。 对 于 初学 者 ,经 常 发 生 的 场景 是 在 学 
习 某 个 知识 点 的 时 候 读 了 很 多 书 ,查阅 了 很 多 资料 , 却 仍然 头脑 昏 昏 ,不 得 要 领 ,在 痛苦 地 花 
了 很 多 时 间 思 索 之 后 才 悦 然 大 悟 。 本 书 的 编写 目标 是 让 读者 “一 点 就 透 , 蔬 然 开朗 ”", 因 此 ， 
书 中 大 量 使 用 了 比喻 图解、 步骤、 注解 等 方法 ,尽量 降低 初学 者 的 学 习 难 度 。 

(2) 例题 简单 直接。 为 了 讲 清楚 算法 ,每 个 算法 都 需要 配合 竞赛 题 和 代码 ,了 解 应 用 
模型 ,并 把 理论 和 编码 结合 起 来 。 本 书 选择 的 例题 大 多 是 简单 .直接 的 “ 裸 题 ”, 很 少 有 综合 
题 ,转弯 题 。 也 就 是 说 ,本 书 的 目的 是 “ 黄 基 ”, 以 及 构建 算法 知识 门类 的 “框架 ", 上 面 的 高 楼 
需要 读者 自己 去 建设 。 对 于 难题 ,综合 题 ,已 经 有 很 多 题解 被 编 成 书 出 版 ,读者 也 可 以 到 网 
上 搜索 题解 ,网 上 的 资源 更 加 丰富 。 

(3) 代码 清晰 、 易 读 。 准 确 、 清 晰 的 代码 能 让 读者 对 算法 知识 的 理解 更 加 透彻 。 本 书 的 
每 段 代 码 都 以 成 为 “模板 ”为 目标 。 这 些 代码 是 在 借鉴 大 量 代 码 的 基础 上 提炼 出 来 的 ,是 作 
者 精心 总 结 的 结晶 。 

(4) 尽量 覆盖 竞赛 的 知识 体系 。 虽 然 本 书 只 能 讲解 部 分 常用 的 知识 点 ,但 是 每 一 章 都 
对 相关 知识 点 做 了 介绍 ,希望 初学 者 在 阅读 本 书 的 同时 扩展 本 书 未 能 讲解 的 知识 。 

总 之 ,本 书 不 是 一 本 题解 ,而 是 一 本 帮助 读者 建立 计算 思维 的 书 , 旨 在 帮助 读者 打造 坚 
实 的 基础 ,获得 继续 深入 的 信心 。 
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最 后 ,用 下 面 的 讨论 作为 本 章 的 结语 。 

算法 竞赛 涉及 的 知识 非常 多 ,有 些 算法 在 竞赛 中 常用 ,有 些 不 常用 。 如 果 初 学 者 过 于 功 
利 ,就 会 纠结 于 哪些 算法 该 学 ,哪些 不 该 学 。 

作者 的 看 法 是 ,学 习 算法 并 不 只 是 为 了 参加 竞赛 。 每 个 经 典 算法 都 经 过 了 无 数 人 的 精 
心 研究 ,是 极为 精巧 .合理 的 思维 运动 ,是 计算 机 科学 这 片 天 空 的 星星 。 学 习 它们 ,本 身 就 是 
很 好 的 思维 练习 , 比 做 多 少 竞赛 * 热 题 "都 强 得 多 ! 
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如 计算 的 资源 

所 算法 的 定义 

如 算法 的 评估 

编程 初学 者 肯定 思考 过 这 样 一 个 问题 : 拿 到 一 个 计算 问题 ,自己 尝试 编程 解决 ,衡量 这 
个 程序 好 坏 的 标准 是 什么 ? 

结果 正确 、 运 行 速 度 快 ,程序 结构 优美 .算法 设计 合理 等 ,这 些 都 可 以 成 为 衡量 的 标准 。 
不 过 ,选择 用 什么 算法 是 最 根本 的 问题 , 它 决 定 了 程序 能 用 还 是 不 能 用 。 

本 章 将 回答 以 下 问题 : 什么 是 算法 ? 为 什么 要 使 用 该 算法 ? 如 何 评价 算法 的 好 坏 ? 如 
何 选择 算法 ? 通过 对 这 些 问题 的 讲解 帮助 算法 竞赛 的 初学 者 建立 基本 的 计算 思维 。 


2.1 计算 的 资源 


程序 运行 时 需要 的 资源 有 两 种 , 即 计 算 时 间 和 存储 空间 。 资 源 是 有 限 的 ,一 个 算法 对 这 
两 个 资源 的 使 用 程度 可 以 用 来 衡量 该 算法 的 优 劣 。 

。 时 间 复 杂 度 : 程序 运行 需要 的 时 间 。 

。 空间 复杂 度 : 程序 运行 需要 的 存储 空间 。 

与 这 两 个 复杂 度 对 应 ,OJ 上 的 题目 一 般 会 有 对 运行 时 间 和 空间 的 说 明 ,例如 : 

Time Limit: 2000/1000ms(Java/Others) 

Memory Limit: 65 536/65 536KB(Java/Others) 

Time Limit 是 对 程序 运行 时 间 的 限制 ,这 个 题目 要 求 在 2s(Java)/1s(C、C++) 内 结束 。 

Memory Limit 是 对 程序 使 用 内 存 的 限制 ,这 里 是 65 536KB, 即 64MB。 

这 两 个 限制 条 件 非 常 重要 ,是 检验 程序 性 能 的 参数 。 不 过 在 现场 赛 中 ,为 了 增加 迷惑 
性 ,可 能 不 会 列 出 这 两 个 参数 ,需要 参赛 队员 自己 判断 。 

所 以 ,队员 拿 到 题目 后 ,第 一 步 要 分 析 的 是 程序 运行 需要 的 计算 时 间 和 存储 空间 。 

编程 竞赛 的 题目 ,在 人 逻辑、 数学、 算法 上 有 不 同 的 难度 : 简单 的 ,可 以 一 眼看 懂 ; 复杂 
的 ,往往 需要 很 多 步骤 才能 找到 解决 方案 。 它 们 对 程序 性 能 考核 的 要 求 是 程序 必须 在 限定 
的 时 间 和 空间 内 运行 结束 。 

这 是 因为 ,问题 的 "有 效 " 解 决 不 仅 在 于 能 否 得 到 正确 答案 ,更 重要 的 是 能 在 合理 的 时 间 
和 空间 内 给 出 答案 。 

李开复 在 “算法 的 力量 ?一 文中 写 道 :“1988 年 ,贝尔 实验 室 副 总 裁 亲 自 来 访问 我 的 学 
校 , 目 的 就 是 想 了 解 为 什么 他 们 的 语音 识别 系统 比 我 开发 的 慢 几 十 倍 , 而 且 , 在 扩大 至 大 词 
汇 系统 后 速度 差异 更 有 几 百 倍 之 多 …… 在 与 他 们 探讨 的 过 程 中 ,我 惊讶 地 发 现 一 个 O(nm) 
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的 动态 规划 居然 被 他 们 做 成 了 OCGr? mm)…… 贝尔 实验 室 的 研究 员 当 然 绝顶 聪明 ,但 他 们 全 
都 是 学 数学 \ 物 理 或 电机 出 身 ,从 未 学 过 计算 机 科学 或 算法 ,这 才 犯 了 这 么 基本 的 错误 。” 

上 文 提 到 的 O(nm) 和 O(n?m) 就 是 时 间 复 杂 度 。 符 号 O 表示 复杂 度 ,O(nm) 可 以 粗略 
地 理解 为 运行 次 数 是 nXm。0OGwm) 比 O(nm) 运 行 时 间 差 不 多 大 信 。 

在 上 面 这 个 语音 识别 的 例子 中 , 设 n==100, 如 果 李 开 复 的 识别 系统 的 运行 时 间 是 1s, 那 
么 贝尔 实验 室 的 系统 需要 100s。 显 然 , 一 个 长 达 100s 才能 得 到 结果 的 语音 识别 系统 肯定 是 
不 实用 的 。 李 开 复 的 这 个 例子 生动 地 说 明了 “好 ”算法 的 属性 一 一 有 合理 的 时 间 效 率 。 

那么 如 何 衡 量程 序 运行 的 时 间 效 率 ? 测量 程序 在 计算 机 上 运行 的 时 间 , 可 以 得 到 一 个 
直观 的 认识 。 

下 面 的 程序 只 有 一 个 for 请 句 , 它 对 k 进行 累加 ,循环 次 数 是 n。 该 程序 用 clock() 函数 
统计 for 循环 的 运行 时 间 。 


#include <bits/stdc++.h> 
using namespace std; 
int main(){ 
int i, k, n = 1e8; 
Clock t start, end; 
start = clock(); 
for(i = 0; i<n; i++) kt+; // 循 环 次 数 
end = clock(); 
cout << (double) (end - start) / CLOCKS_PER_SEC << endl; 
上 


上 面 的 程序 在 一 台 普 通 配 置 的 计算 机 上 和 运行 ,例如 CPU 为 i5-8250U 内 存 为 8GB、64 
位 的 操作 系统 ,结果 如 下 : 

当 n 二 1e8 二 10 时 ,输出 的 运行 时 间 是 0. 164s。 

当 n 二 1e9 时 ,输出 的 运行 时 间 是 1. 645s。 

评测 用 的 OJ 服务 器 ,性 能 可 能 比 这 个 好 一 些 , 也 可 能 差不多 。 

所 以 ,如 果 题 目 要求 “Time Limit: 2000/1000ms(Java/Others)”, 那 么 内 部 的 循环 次 数 
应 该 满足 三 10 , 即 1 亿 次 以 内 。 

由 于 程序 的 运行 时 间 依 赖 于 计算 机 的 性 能 ,不 同 的 计算 机 结果 不 同 ,所 以 直接 把 运行 时 
间作 为 判断 标准 并 不 准确 。 通 常 , 用 程序 执行 的 “次 数 ” 来 衡量 更 加 合理 ,例如 上 述 程序 循环 
了 nn 次 ,把 它 的 运行 效率 记 为 O(n)。 

竞赛 所 给 的 题目 一 般 都 会 有 多 种 解法 , 它 考核 的 是 在 限定 时 间 和 空间 内 解决 问题 。 如 
果 条 件 很 宽松 ,那么 可 以 在 多 种 解法 中 选 一 个 容易 编程 的 算法 ; 如 果 给 定 的 条 件 很 苛刻 , 那 
么 能 选用 的 合适 算法 就 不 多 了 。 

下 面 用 一 个 例子 来 说 明 对 同样 的 问题 如 何 选 用 不 同 的 解法 。 


hdu 1425 “sort” 
Time Limit: 6000/1000ms(Java/Others)Memory Limit: 64/32MB(Java/Others) 
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给 出 n 个 整数 ,请 按 从 大 到 小 的 顺序 输出 其 中 前 m 大 的 数 。 

输入 : 每 组 测试 数据 有 两 行 ,第 1 行 有 两 个 数 nn 和 m(0 二 n,m 二 1000000), 第 2 行 
包含 由 个 各 不 相同 , 且 都 处 于 区 间 [ 一 500 000,500 000] 的 整数 。 

输出 : 对 每 组 测试 数据 按 从 大 到 小 的 顺序 输出 前 m 大 的 数 。 

输入 样 例 : 

53 

3 一 35 92 213 一 644 

输出 样 例 : 

213 92 3 


该 题 的 思路 是 先 对 100 万 个 数 排序 ,然后 输出 前 m 大 的 数 。 题 目 给 出 了 代码 运行 时 
间 , 非 Java 语言 的 时 间 是 1s, 内 存 是 32MB。 

下 面 分 别 用 冒 泡 排序 .快速 排序 、 哈 希 3 种 算法 编程 。 

1. 冒 泡 排序 

首先 用 最 简单 的 冒 泡 排序 算法 求解 上 面 的 问题 。 


# include < bits/stdc++.h> 
using namespace std; 


int a[ 1000001]; // 记 录 数 字 

#define swap(a, b) {int temp = a;a = b; b = temp;} // 交 换 

int n, m; 

void bubble_sort(){ // 冒 泡 排序 ,结果 仍 放 在 a[ ] 中 


Eor(inkt 1 = 1 1<=an= 1 +) 
for(intj = 1; j<=n- i; j++) 
if(a[j] > alj+1]) 
swap(a[j], a[j+1]); 
int main(){ 
while(~scanf("%d%d", gn, gm)){ 
for(int i=1; i<=n; i++) scanf("%d", ga[i]); 
bubble_sort(); 
(din 一 // 打 印 前 m 大 的 数 , 反 序 打印 
if(i == n-m+1) printf("%d\n", a[il]); 
else printf("%d", a[lil]); 


return 0; 


在 bubble_sort() 运 行 后 ,得 到 从 小 到 大 的 排序 结果 ,然后 从 后 往 前 打印 前 m 大 的 数 。 
冒 泡 排序 算法 的 步骤 如 下 : 
(1) 第 一 轮 , 从 第 1 个 数 到 第 n 个 数 ,逐个 对 比 每 两 个 相 邻 的 数 a、5, 如 果 a 二 5, 则 交换 。 
这 一 轮 的 结果 是 把 最 大 的 数 “ 冒 泡 ” 到 了 第 个 位 置 ,在 后 面 不 用 青 管 它 。 
(2) 第 二 轮 , 从 第 1 个 数 到 第 "一 1 个 数 , 对 比 每 两 个 相 邻 的 数 。 这 一 轮 ,把 第 二 大 的 数 
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“ 冒 泡 ” 到 了 第 ”一 1 个 位 置 。 

(3) 继续 以 上 过 程 , 直 到 结束 。 

下 面 分 析 程 序 的 时 间 和 空间 效率 。 

(1) 时 间 复 杂 度 ,也 就 是 程序 执行 了 多 少 步骤 , 花 了 多 少时 间 。 

在 bubble_sort() 中 有 两 层 循环 ,循环 次 数 是 nn 一 1 十 n 一 2 十 … 十 1 之 nn:/2; 在 swap(a,p) 中 
做 了 3 次 操作 ; 总 的 计算 次 数 是 3m?/2, 复 杂 度 记 为 O(w?)。 当 二 100 万 时 ,计算 超过 1 万 
亿 次 。 如 果 提交 到 OJ, 由 于 OJ 每 秒 只 能 运行 1 亿 次 ,必然 返回 TLE 超时 。 可 以 推出 ,只 有 
n 达 1 万 时 才 勉 强 能 用 冒 泡 算法 。 

(2) 空间 复杂 度 , 也 就 是 程序 占用 的 内 存 空间 。 程 序 使 用 int a[1000001] 存 储 数据 ， 
bubble_ sort() 也 没有 使 用 额外 的 空间 。int 是 32 位 整数 ,占用 4 个 字 节 , 所 以 int 
a[1000001] 共 使 用 了 4MB 空间 。 这 是 冒 泡 算 法 的 优点 , 它 不 额外 占用 空间 。 

2. 快速 排序 

快速 排序 是 一 种 基于 分 治 法 的 优秀 排序 算法 。 这 里 先 直 接 用 STL 的 sort() 函 数 , 它 是 
改良 版 的 快速 排序 , 称 为 “内 省 式 排序 ”。 

在 上 面 的 程序 中 ,把 “bubble_sort();” 改 为 “sort(a 十 1, a 十 n 十 1);” 就 完成 了 a[1j 到 
a[n]j 的 排序 ,结果 仍然 保存 在 a[ 中。 

算法 的 时 间 复 杂 度 是 O(nlogzn), 当 n==100 万 时 ,100 万 Xlogz100 万 汪 2000 万 。 

在 hdu 上 提交 ,返回 的 运行 时 间 是 600msD ,正好 通过 OJ 的 测试 。 

3. 哈 希 算法 

哈 希 算法 是 一 种 以 空间 换取 时 间 的 算法 。 本 题 的 哈 希 思路 是 : 在 输入 数字 上 的 时 候 ， 
在 aL500000 十 菇 这 个 位 置 记录 a[500000 十 可 = 1, 在 输出 的 时 候 逐 个 检查 a[ 门 ,如 果 
a[ 让 等 于 1, 表示 这 个 数 存 在 ,打印 出 前 mm 个 数 。 程 序 如 下 : 


#include < bits/stdc++.h> 
using namespace std; 
const int MAXN = 1000001; 
int a[ MAXN]; 
int main(){ 
int n,m; 
while(~scanf("%d%d", gn, gm)){ 
memset(a, 0, sizeof(a)); 
for(int i=0; i<n; i++){ 


”此 题 数 据 量 很 大 ,大 量 时 间 花 在 输入 上 ,如 果 用 cin 输入 ,会 TLE, 真 正 花 在 排序 上 的 时 间 不 多 。 读 者 可 能 有 兴 
趣 了 解 具体 的 执行 时 间 , 可 以 非常 粗略 地 分 析 如 下 : 

(a) 快 排 程序 用 了 600ms, 包 括 输 入 与 输出 时 间 A, 以 及 排序 时 间 B。 

(b) 哈 希 程序 用 了 500ms, 它 的 输入 与 输出 时 间 和 快 排 程序 的 时 间 差 不 多 ,都 是 A; 排序 时 间 是 C。 

(c) 快 排 的 复杂 度 是 O(nlog2n) , 哈 希 的 复杂 度 是 O(n)。 当 n= 二 100 万 时 ,logs100 万 20, 那 么 B 汪 20C。 计 算得 到 
A=:500ms,Bs*100ms,Cs*5ms。 也 就 是 说 ,程序 的 大 部 分 时 间 花 在 了 输入 与 输出 上 。 

(d) 分 析 n= 二 200 万 的 情况 。 快 排 程序 的 总 时 间 六 2A 十 BX(200 万 尖 logz200 万 )/(100 万 Xlog:100 万 )<*2A 十 2. 1B 
一 1210ms; 险 希 程序 的 总 时 间 汪 2A 十 2C 王 1010ms。 看 起 来 似乎 改善 不 大 ,因为 时 间 大 部 分 用 在 处 理 输入 与 输出 上 。 如 
果 一 个 程序 的 输入 用 时 不 多 ,那么 时 间 就 取决 于 排序 算法 。 哈 希 算法 比 快 排 算法 快 logzn 倍 ,很 有 优势 。 
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ty 
scanf(" %d", &t); // 此 题 数据 多 , 如 果 用 很 慢 的 cin 输入 ,肯定 TLE 
a[500000 +t] =1; // 数 字 t, 登记 在 500000 +t 这 个 位 置 
} 
for(int i= MAXN; m>0; i-——) 
if(a[i]){ 
if(m>1) printf("%d", i—500000); 
else printf("% d\n", i— 500000); 
es 
} 
} 
return 0; 


程序 并 没有 做 显 式 的 排序 ,只 是 每 次 把 输入 的 数 按 哈 希 插入 到 对 应 位 置 ,只 有 1 次 操 
作 ; 7 个 数 输入 完毕 ,就 相当 于 排 好 序 了 。 总 的 时 间 复 杂 度 是 O(z) 。 在 hdu 上 提交 ,返回 的 
运行 时 间 是 500ms。 

4. 算法 的 选择 


从 上 述 3 种 程序 可 知 , 对 于 同一 个 问题 ,经 常 存在 不 同 的 解决 方案 ,有 高 效 的 ,也 有 低 效 
的 。 算 法 编程 竞赛 主要 的 考核 点 就 是 在 限定 的 时 间 和 空间 内 解决 问题 。 虽 然 在 大 部 分 情况 
下 只 有 高 效 的 算法 才能 通过 满足 判 题 系统 的 要 求 ,但 是 请 注意 ,并 不 是 只 有 高 效 的 算法 才 是 
合理 的 , 低 效 的 算法 有 时 也 是 有 用 的 。 对 于 程序 设计 竞赛 来 说 ,由 于 竞赛 时 间 极 为 紧张 , 解 
题 速 度 极为 关键 ,只 有 尽快 完成 更 多 的 题目 才能 获得 胜利 。 在 满足 限定 条 件 的 前 提 下 ,用 最 
短 的 时 间 完 成 编码 任务 才 是 最 重要 的 。 低 效 算法 的 编码 时 间 往 往 大 大 低 于 高 效 算法 。 例 
如 ,题目 限定 时 间 是 1s, 现 在 有 两 个 方案 : 中 高 效 算法 0. 01s 运行 结束 ,但 是 代码 有 50 行 ， 
编程 40 分 钟 ; @ 低 效 算法 1s 运行 结束 ,但 是 代码 只 有 20 行 ,编程 10 分 钟 。 显 然 ,此 时 应 该 
选择 低 效 算法 。 

不 过 在 竞赛 时 ,这 种 情况 通常 只 发 生 在 数据 规模 小 的 简单 题 中 , 即 所 谓 的 “签到 题 ”而 
大 部 分 题目 是 没有 这 种 好 事 的 。 所 以 ,这 只 是 一 个 小 小 的 技巧 ,并 没有 太 大 用 处 。 


2.2 算法 的 定义 


前 面 反复 提 到 了 “算法 ”这 个 概念 ,参加 ACM-ICPC、CCPC 竞赛 的 学 生 也 常常 说 “我 们 
在 搞 算法 竞赛 "*。 大 家 也 常常 听 说 “程序 = 算法 十 数据 结构 ”, 算 法 是 解决 问题 的 逻辑 \ 方 法 、 
过 程 ,数据 结构 是 数据 在 计算 机 中 的 存储 和 访问 方式 ,二 者 是 紧密 结合 的 。 

算法 (Algorithm) 是 对 特定 问题 求解 步骤 的 一 种 描述 ,是 指令 的 有 限 序列 。 它 有 以 下 5 
个 特征 。 

(1) 输入 : 一 个 算法 有 和 零 个 或 多 个 输入 。 程 序 可 以 没有 输入 ,例如 一 个 定时 间 钟 程序 ， 
它 不 需要 输入 ,但 是 能 够 每 隔 一 段 时 间 就 输出 一 个 报警 。 

(2) 输出 : 一 个 算法 有 一 个 或 多 个 输出 。 程 序 可 以 没有 输入 ,但 是 一 定 要 有 输出 。 

(3) 有 穷 性 : 一 个 算法 必须 在 执行 有 穷 步 之 后 结束 . 且 每 一 步 都 在 有 穷 时 间 内 完成 。 
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(4) 确定 性 : 算法 中 的 每 一 条 指令 必须 有 确切 的 含义 ,对 于 相同 的 输入 只 能 得 到 相同 
的 输出 。 

(5) 可 行 性 : 算法 描述 的 操作 可 以 通过 已 经 实现 的 基本 操作 执行 有 限 次 来 实现 。 

这 里 以 冒 泡 排序 算法 为 例 , 上 一 节 已 经 描述 过 它 的 执行 步骤 , 它 满足 上 述 5 个 特征 。 

(1) 输入 : 由 守 个 数 构成 的 序列 {fal as, as3，…， a,}。 

(2) 输出 : 对 输入 的 一 个 排序 {at ,as ,as,…, a}, 且 a1<as<as 全 …<@,。 

(3) 有 穷 性 : 算法 在 执行 OG? ) 次 后 结束 ,这 也 是 对 算法 性 能 的 评估 , 即 算法 复杂 度 。 

(4) 确定 性 : 算法 的 每 个 步骤 都 是 确定 的 。 

(5) 可 行 性 : 算法 的 步骤 能 编程 实现 。 

需要 指出 的 是 ,上 述 第 (5) 条 的 可 行 性 也 是 很 重要 的 。 有 些 算法 并 不 能 编 
程 实现 ,例如 一 个 有 趣 的 排序 算法 一 一 珠 排序 (Bead sort?) ,如果 它 用 重力 
法 ,能 够 在 O(1) 或 O(Vz ) 时 间 内 得 到 排序 结果 ,效率 高 到 令 人 惊叹 ,但 是 无 法 
编程 实现 。 


2.3 算法 的 评估 


上 面 已 经 反复 提 到 ,衡量 算法 性 能 的 主要 标准 是 时 间 复 杂 度 ,本 节 再 针对 算法 竞赛 展开 
说 明 。 

为 什么 一 般 不 讨论 空间 复杂 度 呢 ? 在 一 般 情 况 下 ,一 个 程序 的 空间 复杂 度 是 容易 分 析 
的 ,而 时 间 复 杂 度 往往 关系 到 算法 的 根本 逻辑 ,更 能 说 明 一 个 程序 的 优 劣 。 因 此 ,如 果 不 特 
别 说 明 ,在 提 到 “复杂 度 ” 时 一 般 指 时 间 复 杂 度 。 

注意 ,时 间 复 杂 度 只 是 一 个 估计 ,并 不 需要 精确 计算 。 例 如 ,在 一 个 有 个 数 的 无 序数 
列 中 查找 某 个 数 z, 可 能 第 一 个 数 就 是 zx, 也 可 能 最 后 一 个 数 才 是 zx, 平均 查找 时 间 是 n/2 
次 ,但 是 把 查找 的 时 间 复 杂 度 记 为 0(n) ,而 不 是 O(z/2)。 再 如 , 骨 泡 排序 算法 的 计算 次 数 
约 等 于 ww/2 次 ,但 是 仍 记 为 O0z2 ) ,而 不 是 O(n*/2)。 在 算法 分 析 中 ,规模 前 面 的 常数 系 
数 被 认为 是 不 重要 的 。 

还 有 ,OJ 系统 所 判定 的 运行 时 间 是 整个 程序 运行 所 花 的 时 间 , 而 不 是 理论 上 算法 所 需 
要 的 时 间 。 同 一 个 算法 ,不 同 的 人 写 出 的 程序 ,复杂 度 和 运行 时 间 可 能 差别 很 大 , 跟 编程 语 
言 、 逻 辑 结构 . 库 函 数 等 都 有 关系 。 

一 个 程序 或 算法 的 复杂 度 有 以 下 可 能 。 

1. O(1) 

计算 时 间 是 一 个 常数 ,和 问题 的 规模 无关 。 例 如 ,用 公式 计算 时 ,一 次 计算 的 复杂 度 
就 是 O(1); 哈 希 算法 ,用 hash 函数 在 常数 时 间 内 计算 出 存储 位 置 ; 在 矩阵 ALMJLNJ 中 查 
找 第 i 行 第 j 列 的 元 素 , 只 需要 访问 ALi[L7 门 就 够 了 。 

2. O(logsn) 

计算 时 间 是 对 数 , 通 常 是 以 2 为 底 的 对 数 ,每 一 步 计算 后 ,问题 的 规模 减 小 一 信 。 例 如 


® https://en. wikipedia. org/wiki/Bead_sort. 
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在 一 个 长 度 为 n 的 有 序数 列 中 查找 某 个 数 ,用 折 半 查找 的 方法 只 需要 logzn 次 就 能 找到 。 
再 如 分 治 法 ,一般 情况 下 ,在 每 个 步骤 把 规模 减 小 一 倍 ,所 以 一 共有 O(log:z) 个 步 又。 

O(logzn) 和 O(1) 没 有 太 大 差别 。 

3. O(n) 

计算 时 间 随 规模 线性 增长 。 在 很 多 情况 下 ,这 是 算法 可 能 达到 的 最 优 复杂 度 , 因 为 对 
输入 的 个 数 , 程 序 一 般 需要 处 理 所 有 的 数 , 即 计算 次。 例如 查找 一 个 无 序数 列 中 的 某 个 
数 , 可 能 需要 检查 所 有 的 数 。 再 如 图 问题 ,有 V 个 点 和 EE 个 边 , 大 多 数 图 的 问题 都 需要 搜索 
到 所 有 的 点 和 边 ,复杂 度 的 上 限 就 是 O(V 十 E)。 

4. O(nlogsn) 

这 常常 是 算法 能 达到 的 最 优 复杂 度 。 例 如 分 治 法 ,一 共 O(logsn) 个 步骤 ,每 个 步 又 对 
每 个 数 操作 一 次 ,所 以 总 复杂 度 是 O(nlogzn)。 用 分 治 法 思想 实现 的 快速 排序 算法 和 归并 
排序 算法 的 复杂 度 就 是 O(nlogsn) 。 

5. O(nm) 

一 个 两 重 循环 的 算法 ,复杂 度 是 0(z22)。 例 如 冒 泡 排序 是 典型 的 两 重 循环 。 类 似 的 复 
杂 度 有 OC )、OCn') 等 。 

6. O(2") 


一 般 对 应 集合 问题 ,例如 一 个 集合 中 有 个 数 ,要 求 输出 它 的 所 有 子 集 , 子 集 有 2" 个 。 
7. O(n!) 


在 集合 问题 中 ,如 果 要 求 按 顺序 输出 所 有 的 子 集 ,那么 复杂 度 就 是 O(n1)。 

把 上 面 的 复杂 度 分 成 两 类 : 多 项 式 复杂 度 , 包 括 O(1) .O(n)、Olnlogzn) .Om ) 等 ,其 
中 是 一 个 常数 ; Q@ 指 数 复杂 度 ,包括 O(2")、O(n1) 等 。 

如 果 一 个 算法 是 多 项 式 复杂 度 , 称 它 为 高效" 算 法 ; 如 果 一 个 算法 是 指数 复杂 度 , 则 称 
它 为 “ 低 效 " 算 法 。 可 以 这 样 通俗 地 解释 高效” 和“ 低 效 " 算 法 的 区 别 : 多 项 式 复杂 度 的 算法 
随 着 规模 n 的 增加 可 以 通过 堆 释 硬件 来 实现 ,“ 砸 钱 ”" 是 行 得 通 的 ; 而 指数 复杂 度 的 算法 增 
加 硬件 也 无 济 于 事 , 其 增长 的 速度 超出 了 人 们 的 想象 力 。 

竞赛 题目 一 般 的 限制 时 间 是 1s, 对 应 普通 计算 机 的 计算 速度 是 每 秒 千 万 次 级 ,那么 上 
述 的 时 间 复 杂 度 可 以 换算 出 能 解决 问题 的 数据 规模 。 例 如 ,如 果 一 个 算法 的 复杂 度 是 
O(n1), 当 n= 二 11 时 ,11! 二 39 916 800, 这 个 算法 只 能 解决 nn 三 11 以 内 的 问题 。 

下 面 的 表 2. 1 需要 牢记 。 


表 2.1 问题 规模 和 可 用 算法 


可 用 算法 的 时 间 复 杂 度 
国人 全 和 O(logsn) OO0) Onlogsn) | OG) OC2") Oo 
n<1l JV V ~ ~V V 人/ 
n<25 Vv JV V. V. V x 
n<5000 V V ~V ~ x x 
n<10° JV JV V x x x 
n<10” 人/ JV x x x x 
n>10 V x x x x x 
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局 容 器 
如 队列 
局 栈 
本 链表 
局 Set 
大 map 


STL(Standard Template Library) 是 C++ 的 标准 模板 库 , 竟 赛 中 很 多 常用 的 数据 结构 、 
算法 在 STL 中 都 有 ,熟练 地 掌握 它们 在 很 多 题目 中 能 极 大 地 简化 编程 。 本 章 所 介绍 的 内 容 
是 竞赛 训练 的 基本 内 容 , 需 要 完全 掌握 。 

STL 包含 容器 (container)、 和 迭代 器 (iterator)、 空 间 配置 器 (allocator)、 配 接 器 (adapter)、 
算法 (algorithm)、 仿 函数 (functor) 6 个 部 分 。 本 章 介绍 容器 和 两 个 常用 算法 。 


3.1 容 器 


STL 容器 包括 顺序 式 容 器 和 关联 式 容器 。 

1. 顺序 式 容器 

顺序 式 容 器 包括 vector、list、deque、queue、priority_queue,stack 等 ,它们 的 特点 如 下 。 
。 vector: 动态 数组 ,从 末尾 能 快速 插入 与 删除 ,直接 访问 任何 元 素 。 

。 list: 双 链 表 , 从 任何 地 方 快 速 插入 与 删除 。 

。 deque: 双向 队列 ,从 前 面 或 后 面 快 速 插入 与 删除 ,直接 访问 任何 元 素 。 
。 queue: 队列 ,先进 先 出 。 

。 priority_queue: 优先 队列 ,最 高 优先 级 元 素 总 是 第 一 个 出 列 。 

» stack : 栈 ,后 进 先 出 。 

2. 关联 式 容 器 

关联 式 容 器 包括 set\multiset,map、multimap 等 。 

。 set: 集合 ,快速 查找 ,不 允许 重复 值 。 

。 multiset: 快速 查找 ,允许 重复 值 。 

。 map: 一 对 多 映射 ,基于 关键 字 快 速 查找 ,不 允许 重复 值 。 

。 multimap: 一 对 多 映射 ,基于 关键 字 快 速 查找 ,允许 重复 值 。 
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3.1.1 vector 


数组 是 基本 的 数据 结构 ,有 静态 数组 和 动态 数组 两 种 类 型 。 在 算法 竞赛 
中 ,编码 的 惯例 是 : 如 果 空 间 足 够 ,能 用 静态 数组 就 用 静态 数组 ,而 不 用 指针 
管理 动态 数组 ,这 样 编程 比较 简单 并 且 不 会 出 错 ; 如 果 空 间 紧张 ,可 以 用 STL 
的 vector 建立 动态 数组 ,不 仅 节约 空间 ,而 且 也 不 易 出 错 。 

vector 是 STL 的 动态 数组 ,在 运行 时 能 根据 需要 改变 数组 大 小 。 由 于 
它 以 数组 形式 存储 ,也 就 是 说 它 的 内 存 空 间 是 连续 的 ,所 以 索引 可 以 在 常数 时 间 内 完成 ,但 
是 在 中 间 进 行 插入 和 删除 操作 会 造成 内 存 块 的 复制 。 另 外 ,如 果 数 组 后 面 的 内 存 空间 不 够 ， 
需要 重新 申请 一 块 足够 大 的 内 存 。 这 些 都 会 影响 vector 的 效率 。 

vector 容器 是 一 个 模板 类 ,能 存放 任何 类 型 的 对 象 。 

1. 定义 

其 示例 如 表 3. 1 所 示 。 


表 3.1 vector 定义 示例 


功 能 例 子 说 明 

vector < int > a; 默认 初始 化 ,a 为 空 

定义 iat 型 教 组 人 b(a); 用 a 定义 b 
vector < int > a(100); a 有 100 个 值 为 0 的 元 素 
vector < int > a(100, 6); 100 个 值 为 6 的 元 素 
vector < string > a(10, "null"); 10 个 值 为 null 的 元 素 

定义 string 型 数组 vector < string > vec(10,"hello"); 10 个 值 为 hello 的 元 素 
vector < string > b(a. begin(), a. end()); 0 是 a 的 复制 

定义 结构 型 数组 struct pe { int x, y; }5 4 用 来 存 坐 标 
vector < point > a; 


用 户 还 可 以 定义 多 维 数组 ,例如 定义 一 个 二 维 数组 : 
vector < int > a[ MAXN]; 
它 的 第 一 维 大 小 是 固定 的 MAXN ,第 二 维 是 动态 的 。 用 这 个 方式 可 以 实现 图 的 邻接 表 
存储 ,细节 见 本 书 10.2 节 。 
2. 常用 操作 
vector 的 常用 操作 如 表 3. 2 所 示 。 
表 3.2 vector 的 常用 操作 


功 能 例 子 说 明 
赋值 a. push_back(100); 在 尾部 添加 元 素 
元 素 个 数 int size=a. size(); 元 素 个 数 


DD http://www. cplusplus. com/reference/ vector/vector/ 。 
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续 表 
功 能 例 学 说 明 
是 否 为 空 bool isEmpty=a. empty(); 判断 是 否 为 空 
打印 cout << a[0]<< endl; 打印 第 一 个 元 素 
中 间 插 入 a. insert(a. begin() +i, k); 在 第 i 个 元 素 前 面 插入 
尾部 插入 a. push_back(8); 尾部 插入 值 为 8 的 元 素 
尾部 插入 a. insert(a. end(), 10,5); 尾部 插入 10 个 值 为 5 的 元 素 
删除 尾部 a. pop_back(); 删除 末尾 元 素 
删除 区 间 a. erase(a. begin() 十 i，a. begin() 十 j); 删除 区 间 [i, 7 一 菇 的 元 素 
删除 元 素 a. erase(a. begin() 十 2); 删除 第 3 个 元 素 
调整 大 小 a. resize(n) 数组 大 小 变 为 n 
清空 a. clear(); 清空 
翻转 reverse(a. begin(), a. end()); 用 函数 reverse() 翻 转 数组 
排序 sort(a. begin(), a. end()); 用 函数 sort() 排 序 , 从 小 到 大 排 


下 面 用 一 个 例题 来 说 明 vector 的 使 用 。 


hdu 4841“ 圆 桌 问 题 ” 

圆桌 边 围 坐 着 2n 个 人 。 其 中 n 个 人 是 好 人 ,另外 nn 个 人 是 坏人 。 从 第 一 个 人 开始 
数 , 数 到 第 m 个 人 ,立即 赶 走 该 人 ; 然后 从 被 赶 走 的 人 之 后 开始 数 , 再 将 数 到 的 第 m 个 
人 赶 走 , 依 此 方法 不 断 赶 走 围 坐 在 圆桌 边 的 人 。 

预先 应 如 何 安 排 这 些 好 人 与 坏人 的 座位 ,才能 使 得 在 赶 走 nn 个 人 之 后 圆桌 边 围 坐 
的 剩余 的 n 个 人 全 是 好 人 7? 

输入 : 多 组 数据 ,每 组 数据 输入 : n,m 三 32 767。 

输出 : 对 于 每 一 组 数据 ,输出 2n 个 大 写字 母 ,“G" 表 示 好 人 ,“B” 表 示 坏 人 ,50 个 字 
母 为 一 行 ,不 允许 出 现 空白 字符 。 相 邻 数据 间 留 有 一 个 空 行 。 

输入 样 例 : 

23 

2 4 

输出 样 例 

GBBG 

BGGB 


这 个 题目 是 约瑟夫 问题 。 用 vector 模拟 动态 变化 的 圆桌 , 赶 走 个 人 之 后 留 下 的 都 是 
好 大。 
程序 如 下 : 


# include < bits/stdc++.h> 
using namespace std; 
int main(){ 

Vector < int > table; 


// 模 拟 圆 桌 


int n, m; 


二 剖 攻 二 
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while(cin >> n>> m){ 
table. clear( ); 


for(int i=0; i<2*n; i++) table. push_back(i); // 初 始 化 


int pos = 0; 
for(int i=0; i<n; i++){ 
pos = (pos+m—-1) % table. size(); 
table. erase(table. begin() + pos); 
} 
intj= 0; 
for(int i=0; i<2*x*n; i++){ 


if(!(i%50) && i) cout<<endl; 
if(j<table. size() && i== table[j]){ 
j++; 
cout <<"G"; 
} 
else 
cout <<"B"; 
} 
cout << end] << endl; 


} 
return 0; 


} 


// 记 录 当 前 位 置 

// 赶 走 n 个 人 

// 圆 桌 是 个 环 , 取 余 处 理 

// 赶 走 坏人 ,table 人 数 减 1 


// 打 印 预先 安排 座位 
//50 个 字母 一 行 
//table 留 下 的 都 是 好 人 


// 留 一 个 空 和 


忆 


前 面 提 到 ,vector 插入 或 者 删除 中 间 某 一 项 时 需要 线性 时 间 , 即 需要 把 这 个 元 素 后 面 的 
所 有 元 素 往 后 移 或 往 前 移 , 复 杂 度 是 O(n)。 如 果 频 繁 移动 , 则 效率 很 低 。hdu 4841 的 


vector 程序 用 erase() 来 删除 中 间 元 素 就 有 这 个 问题 。 
3.1.2 栈 和 stack 


栈 是 基本 的 数据 结构 之 一 ,特点 是 “先进 后 出 ”。 例 如 乘坐 电梯 时 ,先进 电梯 的 最 后 出 


来 ; 一 盒 泡 腾 片 ,最 先 放 进 盒子 的 药片 位 于 最 底层 ,最 后 被 拿 出 来 。 


头 文件 :#include < stack > 


栈 的 有 关 操 作 

stack < Type> s; // 定 义 栈 ,Type 为 数据 类 型 ,例如 int、float、char 等 

s.push( item); // 把 item 放 到 栈 顶 

s. top(); // 返 回 栈 顶 的 元 素 , 但 不 会 删除 

s.pop() // 删 除 栈 顶 的 元 素 , 但 不 会 返回 .在 出 栈 时 需要 进行 两 步 操作 , 即 
// 先 top() 获 得 栈 顶 元 素 , 再 pop() 删 除 栈 项 元 素 

s. size(); // 返 回 栈 中 元 素 的 个 数 

s.empty(); // 检 查 栈 是 否 为 空 , 如 果 为 空 ,返回 true, 否则 返回 false 


下 面 用 一 个 例子 来 说 明 栈 的 应 用 。 


hdu 1062“Text Reverse” 


翻转 字符 串 。 例 如 输入 “olleh !dlrow”, 输 出 “hello world!”。 


DO http://www. cplusplus. com/reference/stack/stack/. 
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用 栈 模拟 ,下 面 是 程序 : 


# include <bits/stdc++.h> 
using namespace std; 
int main(){ 


int n; 
char ch; 
scanf("%d",gn); getchar(); 
while(n—— ){ 
stack <char> s; 
while(true){ 
ch = getchar(); // 一 次 读 人 一 个 字符 
if(ch==''||ch== "\n'||ch== EOF){ 
while(!s. empty()){ 
printf("% c",s.top()); // 输 出 栈 顶 
s. pop(); // 清 除 栈 顶 
} 
if(ch== '\n'||ch== EOF) break; 
printf(" "); 
} 
else  s.push(ch); // 入 栈 
} 
printf("\n"); 
} 
return 0; 


) 


爆 栈 问题 。 栈 需要 用 空间 存储 ,如 果 深 度 太 大 ,或 者 存 进 栈 的 数组 太 大 ,那么 总 数 会 超 
过 系统 为 栈 分 配 的 空间 ,这 样 就 会 爆 栈 , 即 栈 溢出 。 其 解决 办 法 有 下 面 两 种 : 

(1) 在 程序 中 调 大 系统 的 栈 , 这 种 方法 依赖 于 系统 和 编译 器 ,竞赛 的 时 候 , 在 热身 赛 上 
可 以 试 一 试 。 

(2) 手工 写 栈 。 有 关内 容 见 本 书 10. 5 节 。 
【习题 】 

比较 复杂 的 用 到 栈 的 例子 ,请 练习 hdu 1237“ 简 单 计算 器 ”, 逆 波兰 表达 式 。 


3.1.3 队列 和 queue” 


队列 是 基本 的 数据 结构 之 一 ,特点 是 “先进 先 出 ”。 例 如 排队 ,先进 队列 的 先 得 到 服务 。 
头 文件 : #include < queue > 


队列 的 有 关 操 作 : 

queue <Type> q; // 定 义 栈 ,TYpe 为 数据 类 型 ,例如 int、float、char 等 
q. push(item); // 把 itenm 放 进 队列 

q. front(); // 返 回 队 首 元 素 ,但 不 会 删除 

q. pop(); // 删 除 队 首 元 素 


® http://www. cplusplus. com/reference/queue/queue/. 
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q. back(); // 返 回 队 尾 元 素 
q. size(); // 返 回 元 素 个 数 
gq. empty(); // 检 查 队列 是 否 为 空 


hdu 1702 “ACboy needs your help again!” 
模拟 栈 和 队列 , 栈 是 FILO, 队 列 是 FIFO。 


分 别 用 栈 和 队列 模拟 ,下 面 是 代码 : 


#include < bits/stdc++.h> 
using namespace std; 
int main(){ 
int t,n, temp; 
cin>>t; 
while(t-- ){ 
String str, strl; 
queue < int > Q; 
stack < int >S; 
cin>> n>> str; 
for(int i=0; i<n; i++){ 
if(str == "FIFO"){ // 队 列 
cin>> strl; 
if(strl == "IN"){ 
cin>> temp; Q.push(temp); 
} 
if(strl == "OUT"){ 
if(Q. empty()) cout <<"None"<< endl; 


elsef 
cout << 0. front()<< endl; 
Q. pop(); 
} 
} 
} 
else{ // 栈 


cin>> strl; 
if(strl == "IN"){ 
cin>> temp; S.push(temp); 
} 
if(strl == "OUT"){ 
if(S. empty()) cout <<"None"<< endl; 


else{ 
cout <<S. top()<< endl; 
S. pop(); 

} 


i D0: 
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3.1.4 优先 队列 和 priority_queue? 


优先 队列 ,顾名思义 就 是 优先 级 最 高 的 先 出 队 。 它 是 队列 和 排序 的 完美 结合 ,不 仅 可 以 
存储 数据 ,还 可 以 将 这 些 数据 按照 设 定 的 规则 进行 排序 。 每 次 的 push 和 pop 操作 ,优先 队 
列 都 会 动态 调整 ,把 优先 级 最 高 的 元 素 放 在 前 面 。 


优先 队列 的 有 关 操 作 如 下 : 

q. top(); // 返 回 具有 最 高 优先 级 的 元 素 值 ,但 不 删除 该 元 素 

q. pop(); // 删 除 最 高 优先 级 元 素 

q. push(item); // 插 入 新 元 素 

在 STL 中 ,优先 队列 是 用 二 叉 堆 来 实现 的 ,在 队列 中 push 一 个 数 或 pop 一 个 数 ,复杂 
度 都 是 O(logsn) 。 


可 以 用 优先 队列 对 数据 排序 : 设 定数 据 小 的 优先 级 高 ,把 所 有 数 push 进 优先 队列 后 一 
个 个 top 出 来 ,就 得 到 了 从 小 到 大 的 排序 。 其 总 复杂 度 是 O(nlogzn)。 

图 论 的 Dijkstra 算法 的 程序 实现 用 STL 的 优先 队列 能 极 大 地 简化 代码 ,参考 本 书 的 
10. 9.4 节 。 


【习题 】 
hdu 1873“ 看 病 要 排队 ”。 
3.1.5 链表 和 list? 


STL 的 list 是 数据 结构 的 双向 链表 , 它 的 内 存 空间 可 以 是 不 连续 的 ,通过 指针 来 进行 数 
据 的 访问 , 它 可 以 高 效率 地 在 任意 地 方 删除 和 插入 ,插入 和 删除 操作 是 常数 时 间 的 。 

list 和 vector 的 优 缺 点 正好 相反 ,它们 的 应 用 场景 不 同 。 

(1) vector: 插入 和 删除 操作 少 ,随机 访问 元 素 频繁 。 

(2) list: 插入 和 删除 频繁 ,随机 访问 较 少 。 

下 面 用 一 个 例题 来 说 明 list 的 应 用 。 


hdu 1276“ 士 兵 队列 训练 问题 ” 

一 队 士 兵 报 数 : 从 头 开始 进行 1 至 2 报 数 , 凡 报到 2 的 出 列 , 剩 下 的 向 小 序号 方向 
靠拢 ,再 从 头 开始 进行 1 至 3 报 数 , 凡 报到 3 的 出 列 , 剩 下 的 向 小 序号 方向 靠拢 ,以 后 从 
头 开始 轮流 进行 1 至 2 报 数 .1 至 3 报 数 ,直到 剩 下 的 人 数 不 超 过 3 为 止 。 

输入 : 士兵 人 数 。 

输出 : 剩 下 士兵 最 初 的 编号 。 


® http://www. cplusplus. com/reference/queue/priority_queue/ 。 
回 http://www. cplusplus. com/reference/list/list/。 
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程序 如 下 : 


# include <bits/stdc++.h> 
using namespace std; 
int main(){ 
int t,n; 
cin>>t; 
while(t——-){ 
cin>>n; 
int k=2; 
list < int> mylist; // 定 义 
list< int >::iterator it; 
for(int i=1;i<=n;i+t+) 
mylist, push_ back(i); // 赋 值 
while(mylist. size() > 3) { 
int num = 1; 
for(it = mylist.begin(); it != mylist.end(); ){ 
if(num++ % k == 0) 
让 = mylist,. erase(it); 
else 
i 


k==2? k=3:k=2; //1 至 2 报 数 ,1 至 3 报 数 
} 
for(it = mylist.begin(); it != mylist.end(); it++){ 

证 (it != mylist. begin()) 

Gout ee 

Cout <<* it; 
} 
cout << endl; 


return 0; 


3.1.6 set? 


set 就 是 集合 。STL 的 set 用 二 又 搜索 树 实现 ,集合 中 的 每 个 元 素 只 出 现 一 次 ,并 且 是 
排 好 序 的 。 访 问 元 素 的 时 间 复 杂 度 是 O(logsn) ,非常 高 效 。 

set 和 3. 1.7 节 的 map 在 竞赛 题 中 的 应 用 很 广泛 ,特别 是 需要 用 二 又 搜索 树 处 理 数据 
的 题目 ,如 果 用 set 或 map 实现 ,能 极 大 地 简化 代码 。 


set 的 有 关 操 作 : 

set <Type> A; // 定 义 

A. insert( item); // 把 itenm 放 进 set 
A. erase( item); // 删 除 元 素 item 


四 http://www. cplusplus. com/reference/ set/set/ 。 


i 


算法 竞赛 入 门 到 进 阶 


A.clear(); // 清 空 set 

A.empty (); // 判 断 是 否 为 空 

A. size(); // 返 回 元 素 个 数 

A. find(k); // 返 回 一 个 迭代 器 ,指向 键 值 k 

A. lower_bound(k); // 返 回 一 个 迭代 器 ,指向 键 值 不 小 于 k 的 第 一 个 元 素 
A. upper_bound( ); // 返 回 一 个 迭代 器 ,指向 键 值 大 于 k 的 第 一 个 元 素 


下 面 用 一 个 例子 来 说 明 set 的 应 用 。 


hdu 2094“ 产 生 冠 军 ” 

有 一 群 人 打 乒 兵 球 比赛 ,两 两 捉 对 捕杀 ,每 两 个 人 之 间 最 多 打 一 场 比赛 。 

球赛 的 规则 如 下 : 

如 果 A 打败 了 B,B 又 打败 了 C, 而 A 与 C 之 间 没 有 进行 过 比赛 ,那么 就 认定 A 一 
定 能 打败 C。 

如 果 A 打败 了 B,B 又 打败 了 C, 而 且 C 又 打败 了 A, 那么 A、B.C 三 者 都 不 可 能 成 
为 冠军 。 

根据 这 个 规则 ,无须 循环 较量 ,或 许 就 能 确定 冠军 。 本 题 的 任务 就 是 对 于 一 群 比赛 
选手 ,在 经 过 了 若干 场所 杀 之 后 ,确定 是 否 已 经 产生 了 冠军 。 


这 一 题 的 思路 是 定义 集合 A 和 B, 把 所 有 人 放 进 集合 A, 把 所 有 有 失败 记录 的 放 进 集 
合 B。 如 果 A 一 B 二 1, 则 可 以 判断 存在 冠军 ,否则 不 能 ,请 读者 自己 思考 原因 。 
下 面 的 程序 演示 了 set 的 应 用 。 


hdu 2094 程序 


# include <bits/stdc++.h> 
using namespace std; 
int main(){ 
set < string> A, B; // 定 义 集合 
string sl, s2; 
int n; 
while(cin >> n && n){ 
for(int i=0; i<n; i++) { 
cin >> sl > s2; 
A. insert(s1); A. insert(s2); // 把 所 有 人 放 进 集合 A 
B. insert(s2); // 把 失败 者 放 进 集合 B 
} 
if(A.size() - B.size() == 1) 
cout << "Yes" << endl; 
else 
cout << "No" << endl; 
A.clear(); B.clear(); 


return 0; 


sD 
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3.1.7 map? 


这 里 有 一 个 常见 的 问题 ; 及 n 个 学 生 , 每 人 有 姓名 name 和 学 号 id, 现 在 给 定 一 个 学 生 
的 name, 要 求 查找 他 的 id。 

简单 的 做 法 是 定义 string name[nj 和 int id[n]( 可 以 放 在 一 个 结构 体 中 ) 存 储 信息 , 然 
后 在 name[ ] 中 查找 这 个 学 生 , 找 到 后 输出 他 的 id。 这 样 做 的 缺点 是 需要 搜索 所 有 的 name[ ]， 
复杂 度 是 O(n) ,效率 很 低 。 

利用 STL 中 的 map 容器 可 以 快速 地 实现 这 个 查找 ,复杂 度 是 O(logzn) 。 

map 是 关联 容器 , 它 实现 从 键 (key) 到 值 (value) 的 映射 。map 效率 高 的 原因 是 它 用 于 
衡 二 又 搜索 树 来 存储 和 访问 。 

在 上 述 例子 中 ,map 的 具体 操作 如 下 。 

(1) 定义 : map < string, int > student, 存 储 学 生 的 name 和 id。 

(2) 赋值 : 例如 studentL"Tom"]=15。 这 里 把 “Tom” 当 成 普通 数组 的 下 标 来 使 用 。 

(3) 查找 : 在 找 学 号 时 ,可 以 直接 用 student["Tom'"] 表 示 他 的 id, 不 用 再 去 搜索 所 有 的 
姓名 。 

map 用 起 来 很 方便 。 对 于 它 的 插入 查找、 访问 等 操作 ,请 读者 自己 阅读 有 关 资 料 ,并 
且 认 真 掌握 。 

下 面 用 一 个 例题 来 简单 介绍 map 的 使 用 。 


& 


hdu 2648 “Shopping” 

女孩 dandelion 经 常 去 购物 ,她 特别 喜欢 一 家 叫 “memory” 的 商店 。 由 于 春节 快 到 
了 ,所 有 商店 的 价格 每 天 都 在 上 涨 。 她 想 知道 这 家 商店 每 天 的 价格 排名 。 

输入 : 

第 1 行 是 数字 n(n 三 10 000) ,代表 商店 的 数量 。 

后 面 nn 行 ,每 行 有 一 个 字符 囊 ( 长 度 小 于 31, 只 包含 小 写字 母 和 大 写字 母 ) ,表示 商 
店 的 名 称 。 

然后 一 行 是 数字 m(1 三 m 三 50) ,表示 天 数 。 

后 面 有 m 部 分 ,每 部 分 有 n 行 ,每 行 是 数字 s 和 一 个 字符 串 轧 ,表示 商店 p 在 这 一 天 
涨 价 s。 

输出 : 包含 m 行 ,第 i 行 显示 第 i 天 后 店铺 “memory” 的 排名 。 排 名 的 定义 为 如 果 
有 +t 个 商店 的 价格 高 于 memory”, 那么 它 的 排名 是 t 十 1。 


本 题 代 码 如 下 : 


#include < bits/stdc++.h> 
using namespace std; 
int main(){ 

nb ny Wy 


® http://www. cplusplus. com/reference/map/map/. 
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map < string, int> shop; 
while(cin>>n) { 


string s; 

for(int i=1; i<=n; it+) cin>> s; ”// 输 入 商店 名 字 , 实际 上 用 不 着 处 理 
cin >> mi 

while(m——){ 


for(int i=1; i<=n; i++) { 
cin> p> s; 
shop[s] += p; // 用 map 可 以 直接 操作 商店 ,加 上 价格 
} 
int rank = 1; 
map < string, int >: :iterator it; ”// 和 迭代 器 
for(it= shop. begin(); it != shop.end(); it++) 
if(it—> second > shop[ "memory"]) // 比 较 价格 
rank++; 
cout << rank << end]; 
} 
shop. clear(); 


} 


return 0; 


3.2 sort() 


STL 的 排序 函数 sort()? 是 算法 竞赛 中 最 常用 的 函数 之 一 , 它 的 定义 有 以 下 两 种 ， 

(1) void sort(RandomAccesslIterator first, RandomAccesslterator last); 

(2) void sort(RandomAccessJterator first, RandomAccessIterator last, Compare comp) ; 

返回 值 : 无 。 

复杂 度 : O(nlogsn)。 

注意 , 它 排序 的 范围 是 [first、last) ,包括 first, 不 包括 last。 

1. sort() 的 比较 函数 

排序 是 对 比 元 素 的 大 小 。sort() 可 以 用 自 定 义 的 比较 函数 进行 排序 ,也 可 以 用 系统 的 
4 种 函数 排序 , 即 less() 、greater() ,less_equal() .greater_equal() 。 在 默认 情况 下 ,程序 是 
按 从 小 到 大 的 顺序 排序 的 ,less() 可 以 不 写 。 

下 面 是 程序 例子 。 


# include < bits/stdc++.h> 
using namespace std; 


bool my_less(int i, int j) {return (i<j);} // 自 定义 小 于 
bool my_greater(int i, int j) {return (i>j);} // 自 定义 大 于 
int main(){ 


® http://www. cplusplus. com/reference/algorithm/ sort/ 。 
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vector <int >a = {3,7,2,5,6,8,5,4}; 


sort(a. begin(),a. begin() + 4); // 对 前 4 个 排序 ,输出 23576854 
//sort(a. begin(),a.end()); // 从 小 到 大 排序 , 输出 23455678 
//sort(a. begin(),a.end(), less< int >()); // 输 出 23455678 
//sort(a. begin(),a.end(),my_less); // 自 定义 排序 ,输出 23455678 
//sort(a.begin(),a.end(),greater<int>()); // 从 大 到 小 排序 ,输出 87655432 
//sort(a. begin(),a. end(),my greater); // 输 出 87655432 

for(int i=0; i<a. size(); i++) // 输 出 


cout << a[ i]<< 


return 0; 


} 


sort() 还 可 以 对 结构 变量 进行 排序 ,例如 : 


struct Student{ 
char name[ 256]; 
int score; 

}; 

bool compare(struct Student * a,struct Student * b){ // 按 分 数 从 大 到 小 排序 
return a 一 > Score > b 一 > score; 


} 


Vector < struct Student * > list; // 定 义 list, 把 学 生 信息 存 到 list 里 


sort(list. begin(), list.end(), compare); // 按 分 数 排序 
2. 相关 函数 


stable_sort() : 当 排序 元 素 相等 时 ,保留 原来 的 顺序 。 在 对 结构 体 排序 时 , 当 结 构 体 中 
的 排序 元 素 相 等 时 ,如 果 需 要 保留 原 序 , 可 以 用 stable_sort() 。 

partial_sort() : 局 部 排序 。 例 如 有 10 个 数字 , 求 最 小 的 5 个 数 。 如 果 用 sort() ,需要 先 
全 部 排序 ,再 输出 前 5 个 ; 而 用 partial_sort() 可 以 直接 输出 前 5 个 。 


3.3 next_ permutation() 


STL 提供 求 下 一 个 排列 组 合 的 函数 next_permutation()?。 例 如 3 个 字符 a、b、c 组 成 
的 序列 ,next_permutation() 能 按 字典 序 返 回 6 个 组 合 , 即 abc、acb、bac、bca、cab、cba。 

函数 next_permutation() 的 定义 有 下 面 两 种 形式 : 

(1) bool next_permutation(Bidirectionallterator first, Bidirectionallterator last) ; 

(2) bool next_permutation( Bidirectionallterator first, Bidirectionallterator last, Compare 
comp); 


返回 值 : 如 果 没 有 下 一 个 排列 组 合 ,返回 false, 和 否则 返回 true。 每 执行 next_permutation() 


四 http://www. cplusplus. com/reference/algorithm/next_permutation/ 。 
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一 次 ,就 会 把 新 的 排列 放 到 原来 的 空间 里 。 
复杂 度 : O(n)。 
注意 , 它 排列 的 范围 是 [first, last) ,包括 first, 不 包括 last。 
在 使 用 next_permutation() 的 时 候 . 初 始 序 列 一 般 是 一 个 字典 序 最 小 的 序列 ,如 果 不 
是 ,可 以 用 sort() 排 序 , 得 到 最 小 序列 ,然后 再 使 用 next_permutation(), 例 题 见 本 书 的 
4 
下 面 的 例题 是 该 函数 的 一 个 简单 应 用 。 


hdu 1027 “Ignatius and the Princess IT” 
给 定 史 个 数字 ,从 1 到 nn, 要 求 输出 第 mm 小 的 序列 。 
输入 : 数字 和 mm,1 二 n 志 1000,1 夺 m 夸 10 000。 
输出 : 输出 第 m 小 的 序列 。 


程序 的 思路 是 首先 生成 一 个 123…n 的 最 小 字典 序列 , 即 初始 序列 ,然后 用 next_ 
permutation() 一 个 一 个 地 生成 下 一 个 字典 序 更 大 的 序列 。 
程序 如 下 : 


# include < bits/stdc++.h> 
using namespace std; 
int a[1001]; 
int main(){ 
int n, m; 
while(cin>>n>>m){ 
for(int i=1; i<=n; it+) a[i] = i; ”// 生 成 一 个 字典 序 最 小 的 序列 
intb = 1; 
do{ 
if(b == m) break; 
b++; 
}while(next_permutation(a+1,a+n+1)); 
// 注 意 第 一 个 是 a+1, 最 后 一 个 是 a+n 
for(int i=1; i<n; i++) // 输 出 第 m 大 的 字典 序 
cout << a[i] < " "; 
cout << a[n] << endl; 
} 
return 0; 


} 


与 next_permnutation() 相 关 的 函数 如 下 : 
。 prev_permutation(): 求 前 一 个 排列 组 合 。 
。 lexicographical_ compare() : 字典 比较 。 


【习题 】 
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[人 


扎 递 归 和 排列 

气 子 集 生 成 和 组 合 问题 

名 BFS 和 队列 

忆 Ax 算 法 

名 DFS 和 递归 

如 八 数码 问题 

气 回溯 与 剪 枝 

如 迭代 加 深 搜 索 

IDA* 

搜索 是 基本 的 编程 技术 ,在 算法 竞赛 学 习 中 是 基础 的 基础 。 搜 索 使 用 的 算法 是 BFS 和 
DFS,BFS 用 队列 .DFS 用 递归 来 具体 实现 。 在 BFS 和 DFS 的 基础 上 可 以 扩展 出 Ax 算 
法 、 双 向 广 搜 算法 、 迭 代 加 深 搜 索 、IDA * 等 技术 。 本 章 详细 介绍 了 这 些 知 识 点 。 


搜索 技术 是 “暴力 法 "算法 思想 的 具体 实现 。 

人 们 常 说 :“ 要 利用 计算 机 强大 的 计算 能 力 .” 如 果 答 案 在 一 大 堆 数 字 里 面 ,让 计算 机 一 
个 个 去 试 ,符合 条 件 的 不 就 是 答案 了 吗 ? 

没 错 , 最 基本 的 算法 思想 “暴力 法 ”就 是 这 样 做 的 。 例 如 ,银行 卡 密码 是 6 位 数字 , 共 
100 万 个 ,对 于 计算 机 来 说 ,尝试 100 万 次 只 需要 一 瞬间 。 不 过 计算 机 也 不 是 无 敌 的 。 为 了 
应 对 计算 机 强大 的 计算 能 力 , 可 以 对 密码 进行 强化 设计 。 例 如 网 络 账号 密码 ,大 部 分 网 站 都 
要 求 长 度 在 8 位 以 上 ,并且 混合 数字 .字母 .标点 等 。 从 40 多 个 符号 中 选 8 个 组 成 密码 , 数 
量 有 40X39X38X37X36X35X34X33 二 3 万 亿 , 即 使 用 计算 机 也 不 能 很 快 算出 来 。 

暴力 法 (Brute force, 又 译 为 蛮 力 法 ): 把 所 有 可 能 的 情况 都 罗列 出 来 ,然后 逐一 检查 ， 
从 中 找到 答案 。 这 种 方法 简单 、 直 接 , 不 玩 花样 ,利用 了 计算 机 强大 的 计算 能 力 。 

虽然 暴力 法 常常 是 低 效 的 代名词 .但 是 它 仍 然 很 有 用 ,原因 如 下 : 

(1) 很 多 问题 只 能 用 暴力 法 解决 ,例如 猜 密码 。 

(2) 对 于 小 规模 的 问题 ,暴力 法 完全 够 用 ,而 且 避 免 了 高 级 算法 需要 的 复杂 编码 ,在 竞 
赛 中 可 以 加 快 解 题 速度 。 在 竞赛 中 也 可 以 用 暴力 法 来 构造 测试 数据 ,以 验证 高 级 算法 的 正 
确 性 。 

(3) 把 暴力 法 当 作 参照 (benchmark) 。 既 然 暴 力 法 是 “最 差 ” 的 ,那么 可 以 把 它 当 成 一 个 
比较 来 衡量 另外 的 算法 有 多 “好 ”。 拿 到 题目 后 ,如 果 没 有 其 他 思路 ,可 以 先 试 试 暴力 法 ,看 
是 否 能 帮助 产生 灵感 。 

不 过 ,在 具体 编程 时 常常 需要 对 暴力 法 进行 优化 ,以 减少 搜索 空间 ,提高 效率 。 例 如 利 
用 剪 枝 技术 跳 过 不 符合 要 求 的 情况 ,从 而 减少 复杂 度 。 
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虽然 暴力 搜索 的 思路 很 简单 ,但 是 操作 起 来 并 不 容易 。 一 般 有 以 下 操作 : 

(1) 找到 所 有 可 能 的 数据 ,并 且 用 数据 结构 表示 和 存储 。 

(2) 剪 枝 。 尽 量 多 地 排除 不 符合 条 件 的 数据 ,以 减少 搜索 的 空间 。 

(3) 用 某 个 算法 快速 检索 这 些 数据 。 

其 中 的 第 一 步 就 可 能 很 不 容易 。 例 如 迷宫 问题 ,如 何 列举 从 起 点 到 终点 的 所 有 可 能 的 
路 径 ?? 再 如 图 论 中 的 “最 短路 径 问 题 ”, 在 地 图 上 任 取 两 个 点 ,它们 之 间 所 有 可 行 的 路 径 可 
能 是 天 文 数字 ,以 至 于 根本 不 能 一 一 列举 出 来 。 所 以 计算 最 短路 径 的 Dijkstra 算法 是 用 贪 
心 法 ,进行 从 局 部 扩散 到 全 局 的 搜索 ,不 用 列举 所 有 可 能 的 路 径 。 

暴力 法 的 主要 操作 是 搜索 ,搜索 的 主要 技术 是 BFS 和 DFS。 掌 握 搜索 技术 是 学 习 算法 
竞赛 的 基础 。 在 搜索 时 ,具体 的 问题 会 有 相应 的 数据 结构 ,例如 队列 、 栈 、 图 、 树 等 ,读者 应 该 
能 熟练 地 在 这 些 数据 结构 上 进行 搜索 的 操作 。 

本 章 主要 讲解 BFS 和 DFS, 以 及 基于 它们 的 优化 技术 ,并 以 一 些 经 典 的 搜索 问题 为 例 
讲解 算法 思想 ,例如 排列 组 合 、 生 成 子 集 、 八 皇后 、 八 数码 ,图 遍历 等 。 


4.1 递归 和 排列 


排列 和 组 合 问题 是 在 暴力 枚 举 的 时 候 经 常 遇 到 的 ,一 般 有 3 种 常见 情况 。 
问题 4. 1: 打印 个 数 的 全 排列 , 共 n! 个 。 


问题 4.2: 打印 个 数 中 任意 个 数 的 全 排列 ， NE 4 人 


问题 4. 3: 打印 个 数 中 任意 m 个 数 的 组 合 , 共 Cr 一 一 2 个 。 


ml(n—m)! | 

本 节 用 递归 程序 来 实现 问题 4. 1 和 问题 4.2, 问 题 4. 3 将 在 下 一 节 中 讲解 。 

在 计算 机 编程 教材 中 都 会 提 到 递归 的 概念 和 应 用 ,一 般 会 用 数学 中 的 递 推 方程 来 讲解 
递归 的 概念 ,例如 Foz) = 一 1) 十 FC2 一 2)。 在 计算 机 系统 中 ,递归 是 通过 艇 套 来 实现 
的 ,涉及 指针 、 地 址 、 栈 的 使 用 。 

从 算法 思想 上 看 ,递归 是 把 大 问题 逐步 缩小 ,直到 变 成 最 小 的 同类 问题 的 过 程 。 例 如 
27 一 1 一 7 一 2 一 … 一 1 ,最 后 的 小 问题 的 解 是 已 知 的 ,一 般 是 给 定 的 初始 条 件 。 在 递归 的 
过 程 中 ,由 于 大 问题 和 小 问题 的 解决 方法 完全 一 样 ,那么 大 家 自然 可 以 想到 ,大 问题 的 程序 
和 小 问题 的 程序 可 以 写成 一 样 。 一 个 递归 函数 直接 调用 自己 ,就 实现 了 程序 的 复 用 。 

递归 和 分 治 法 的 思路 非常 相似 ,分 治 是 把 一 个 大 问题 分 解 为 多 个 类 型 相同 的 子 问题 。 
事实 上 ,一 些 涉及 分 治 法 的 问题 可 以 用 递归 来 编程 ,典型 的 有 快速 排序 .归并 排序 等 。 

对 于 编程 初学 者 来 说 ,递归 是 一 个 难以 理解 的 编程 概念 ,很 容易 绕 晤 。 为 了 帮助 理解 ， 
可 以 一 步 步 打印 出 递归 函数 的 输出 ,看 它 从 大 到 小 解决 问题 的 过 程 。 

编程 竞赛 中 的 暴力 法 常常 需要 考虑 所 有 可 能 的 情况 ,用 递归 编程 可 以 轻松 ,方便 地 实现 
对 搜索 空间 所 有 状态 的 遍历 。 


@ 用 DFS 可 以 实现 ,程序 也 非常 短 。 在 学 完 本 章 之 后 ,读者 就 能 轻松 地 写 出 程序 。 
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【问题 4.1】 打印 7 个 数 的 全 排列 。 

在 用 递归 解决 这 个 问题 之 前 先 给 出 STL 的 实现 方法 。 

1. 用 STL 输出 全 排列 

如 果 需 要 全 排列 的 场景 比较 简单 ,可 以 直接 用 C++ STL 的 库 函 数 next_permutation 
0) , 它 按 字典 序 输 出 下 一 个 排列 。 在 使 用 之 前 , 先 用 sort() 给 数据 排序 ,得 到 最 小 排列 ,然后 
每 调用 next_permutation() 一 次 ,就 得 到 一 个 大 一 点 的 排列 。 

next_permutation() 的 优点 是 能 按 从 小 到 大 的 顺序 输出 排列 。 


# include < iostream> 


# include <algorithm> // 包 含 sort() 和 next_permutation() 函 数 
using namespace std; 
int main(){ 
int data[4] = {5, 2, 1, 4}; 
sort(data, data + 4); // 排 序 , 得 到 最 小 排列 
dof 
for(int i = 0; i<4; ++i) // 输 出 一 个 排列 


cout << data[i] << " "; 
cout << endl; 
jwhile(next_permutation(data, data + 4)); // 把 下 一 个 排列 放 在 data 中 
return 0; 


} 


2. 用 递归 求全 排列 

下 面 用 递归 求全 排列 ,代码 很 短 ,但 是 理解 起 来 并 不 容易 。 读 者 可 以 自己 
打印 每 一 个 全 排列 的 输出 ,然后 认真 理解 。 

在 用 递归 之 前 ,为 了 对 比 , 先 给 出 一 个 简单 .粗暴 的 方法 : 以 10 个 数 的 全 
排列 为 例 , 用 排列 组 合 的 思路 写 一 个 10 级 的 for 循环 ,在 每 个 for 中 选 一 个 和 
前 面 的 for 用 过 的 都 不 同 的 数 。 当 n=10 时 ,一 共有 10!=3 628 800 个 排列 。 


#include < bits/stdc++.h> 
using namespace std; 


int data[ ] = {7,1,2,3,4,5,6,8,9,10,12}; // 本 例子 中 用 到 前 10 个 数 
int main(){ 

int num = 10; 

FH //10 个 for 循环 


for(i = 0; i<num; i++) 
for(j=0; j<num; j++) 


if(j (= i) // 让 j 不 等 于 i 
for(k = 0; k< num; k++) 
if(k!= j && k != i) // 让 kk 不 等 于 i、j 


for(m = 0; m< num; m++) 
if(m!=j && ml=i&& ml=k)  // 让 m 不 等 于 ij 


// 最 后 打印 出 一 个 全 排列 : cout << data[i]<< data[j].…. 


ws 
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上 述 的 程序 看 起 来 很 * 笨 ”, 下 面 用 递归 来 写 ,显得 很 * 美 ”。 

用 递归 求全 排列 的 思路 : 设 定数 字 是 {1 2 3 4 5…n} 

(1) 让 第 1 个 数 不 同 ,得 到 个 数列 。 其 办 法 是 把 第 1 个 和 后 面 的 每 个 数 交 换 。 
12345°n 

21345… 刀 


n23451 

以 上 ?个 数列 ,只 要 第 1 个 数 不 同 ,不 管 后 面 的 一 1 个 数 是 怎么 排列 的 ,这 个 数列 都 
不 同 。 

这 是 递归 的 第 一 层 。 

(2) 继续 : 在 上 面 的 每 个 数列 中 去 掉 第 1 个 数 , 对 后 面 的 2 一 1 个 数 进行 类 似 的 排列 。 
例如 从 上 面 第 2 行 的 {2 1 3 4 5…z} 进 入 第 二 层 ( 去 掉 首 位 2): 

1345n 

8145% 


| 
以 上 ?一 1 个 数列 ,只 要 第 1 个 数 不 同 ,不 管 后 面 的 n 一 2 个 数 是 怎么 排列 的 ,这 一 1 个 
数列 都 不 同 。 
这 是 递归 的 第 二 层 。 
(3) 重复 以 上 步骤 ,直到 用 完 所 有 数字 。 
在 上 面 所 有 过 程 完成 后 ,数列 的 总 个 数 是 nX (nn 一 1 X (n 一 2)…X1=nl。 
递归 打印 全 排列 


#include <bits/stdct+.h> 
using namespace std; 
#define Swap(a, b) {int temp = a;a = b; b = temp;} 
// 交 换 ,也 可 以 直接 用 C++ STL 中 的 swap() 函 数 ,但 是 速度 慢 一 些 
int data[ ] = {1,2,3,4,5,6,8,9,10,32,15,18,33}; ”// 本 例子 中 只 用 到 前 面 10 个 数 
int num = 0; // 统 计 全 排列 的 个 数 ,验证 是 不 是 3628800 


int Perm( int begin, int end){ 


int i; 
证 (begin == end) { // 递 归结 束 ,产生 一 个 全 排列 
// 如 果 有 必要 ,在 此 打印 或 处 理 这 个 全 排列 
Dum++ // 统 计 全 排列 的 个 数 
else 
for(i = begin; i<=end; i++) { 
Swap(data[ begin], data[i]); // 把 当前 第 1 个 数 与 后 面 的 所 有 数 交换 位 置 
Perm(begin+1, end); 
Swap(data[ begin], data[i]); // 恢 复 , 用 于 下 一 次 交换 
} 
} 
int main(){ 
Perm(0, 9); // 求 10 个 数 的 全 排列 
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cout << num << endl; // 打 印 出 排列 总 数 ,num = 10! = 3628800 
} 


用 这 个 程序 可 以 检验 普通 计算 机 的 计算 能 力 。 在 上 面 的 程序 中 加 入 clock() 统 计时 间 


# include <ctime > 
int main() { 

clock_t start, end; 

start = clock(); 

Perm(0, 9); 

end = clock(); 

cout << (double) (end - start) / CLOCKS_PER_SEC << endl; 
} 


在 作者 的 笔记 本 电脑 上 运行 上 述 程序 : 

(1) Perm(0,9) ,计算 10 个 数 的 全 排列 : 101 二 3 628 800, 用 时 0. 055s。 

(2) Perm(0,10) ,计算 11 个 数 的 全 排列 : 11! 王 39 916 800, 用 时 0. 598s。 

(3) Perm(0,11) ,计算 12 个 数 的 全 排列 : 12! 王 479 001 600, 用 时 7. 305s。 

121/111/10! 的 比值 与 7. 305s/0.598s/0.055s 的 比值 非常 接近 。 

结论 : 笔记 本 电脑 的 计算 能 力 大 约 是 每 秒 千 万 次 数量 级 。 

竞赛 题 在 一 般 情况 下 限时 1s, 所 以 对 于 需要 全 排列 的 题目 ,其 元 素 个 数 应 该 少 于 11 个 。 

需要 注意 的 是 ,从 算法 复杂 度 上 看 ,上 述 两 个 程序 的 复杂 度 一 样 ,都 是 O(z1)。 对 于 求 
全 排列 这 样 的 问题 ,不 可 能 有 复杂 度 小 于 O(n1) 的 算法 ,因为 输出 的 数量 就 是 n!。 在 算法 理 
论 中 ,对 必须 要 输出 的 元 素 进行 的 计数 叫 作 “平凡 下 界 ”, 这 是 程序 运行 所 需要 的 最 少 花费 。 

上 面 的 程序 只 要 进行 小 的 修改 就 能 解决 问题 4. 2。 

【问题 4.2】 打印 个 数 中 任意 mm 个 数 的 全 排列 。 

例如 在 10 个 数 中 取 任意 3 个 数 的 全 排列 ,在 Perm() 中 只 修改 一 个 地 方 就 可 以 了 : 


if(begin == 3) { // 把 Perm( ) 函 数 中 的 end 改 为 3 即 可 ,其 他 都 不 变 
cout << data[0]<< data[1]<< data[2]<< endl;// 打 印 10 个 数 中 3 个 数 的 全 排列 
mum++ // 统 计 全 排列 的 个 数 , 应 该 是 10x9x8= 720 个 


} 


【问题 4.3】 打印 个 数 中 任意 m 个 数 的 组 合 。 

问题 4.3 和 问题 4. 1 的 区 别 为 排列 是 有 序 的 ,组 合 是 无 序 的 。 其 中 一 个 特例 是 在 个 
数 中 取 ? 个 数 的 组 合 , 只 有 1 种 情况 ,就 是 这 个 数 本 身 。 

问题 4.3 将 在 4.2 节 中 讲解 。 


4.2 子 集 生成 和 组 合 问 题 


在 4.1 节 求 10 个 数 的 排列 问题 中 ,如 果 不 需要 输出 全 排列 ,而 是 输出 组 合 , 即 子 集 ( 子 
集 内 部 的 元 素 是 没有 顺序 的 ) ,那么 该 如 何 做 呢 ? 
志 通 人 汉 
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一 个 包含 个 元 素 的 集合 {ao, a， as， a3,…， a,-1), 它 的 子 集 有 {$ } {a} {az} srs 
{a0s a1s ae}yes {a0s als ay dss "3 an-1}s 共 2" 

用 二 进 制 的 概念 进行 对 照 是 最 直观 的 。 

例如 "一 3 的 集合 {ao。, al ,az} , 它 的 子 集 和 二 进 制 数 的 对 应 关系 如 表 4. 1 所 示 。 


表 4.1 n=3 的 集合 {a, ,ai ,az } 的 子 集 和 二 进 制 数 的 对 应 关系 


邓 集 $ ao an aa yao az aa ,ao az yq1 aa sa1 yao 
二 进 制 数 | 000 001 010 011 100 101 和 111 
所 以 ,每 个 子 集 对 应 一 个 二 进 制 数 ,这 个 二 进 制 数 中 的 每 个 1 都 对 应 着 这 个 子 集 中 的 某 


个 元 素 ,而 且 子 集中 的 元 素 是 没有 顺序 的 。 
从 这 个 表 也 可 以 理解 为 什么 子 集 的 数量 是 2" 个 ,因为 所 有 二 进 制 数 的 总 个 数 是 2"。 
下 面 的 程序 通过 处 理 每 个 二 进 制 数 中 的 1 eine 


#include <bits/stdc++.h> 
using namespace std; 
void print_subset(int n){ 
for(int i=0;i<(1<<n);i++) { 
//i:0~2", 每 个 二 的 二 进 制 数 对 应 一 个 子 集 , 一 次 打印 一 个 子 集 ,最 后 得 到 所 有 子 集 
for(int j=0;j<n;j+t+) // 打 印 一 个 子 集 , 即 打印 i 的 二 进 制 数 中 所 有 的 1 
if(i&g (1<<j)) // 从 i 的 最 低位 开始 逐个 检查 每 一 位 ,如 果 是 1, 打印 
cout << j <<" "; 
cout << endl; 
} 
} 


int main(){ 
int n; 
cin>n; //n: 集 合 中 元 素 的 总 数量 
print_subset (n); // 打 印 所 有 的 子 集 


回 到 问题 4. 3: 2 个 数 中 任意 m 个 数 的 组 合 。 对 照 子 集 生成 的 二 进 制 方法 ,已 经 
个 子 集 对 应 一 个 二 进 制 数 。 那 么 一 ao 
。 所 以 ， i 1 的 个 数 为 上 的 二 进 制 数 ,这 些 二 进 制 数 就 是 需要 打印 的 
二 
那么 如 何 判断 二 进 制 数 中 1 的 个 数 为 &9? 简单 的 方法 是 对 这 个 位 二 进 制 数 逐 位 检 
查 , 共 需要 检查 nn 次 。 
另外 有 一 个 更 快 的 方法 , 它 可 以 直接 定位 二 进 制 数 中 1 的 位 置 , 跳 过 中 间 的 0。 它 用 到 
一 个 神奇 的 操作 一 一 kk 二 kk & (kk 一 1) ,功能 是 消除 kk 的 二 进 制 数 的 最 后 一 个 1。 连 续 进 
行 这 个 操作 ,每 次 消除 一 个 1, 直 到 全 部 消除 为 止 ,操作 次 数 就 是 1 的 个 数 。 例 如 二 进 制 数 
1011 ,经 过 连续 3 次 操作 后 ,所 有 的 1 都 消除 了 : 


@ glibc 有 处 理 二 进 制 数 的 内 部 函数 ,其 中 int __builtin_popcount(unsigned int zx) 直接 返回 zx 中 1 的 个 数 。 
到 胃 呈 
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1011 & (1011—1)=101]1 & 1010=1010 
1010 & (1010—1)=1010 & 1001=1000 
1000 & (1000—1)=1000 & 0111=0000 
利用 这 个 操作 可 以 计算 出 二 进 制 数 中 1 的 个 数 。 用 num 统计 1 的 个 数 ,具体 步骤 
如 下 : 
(1) 用 kk 二 kk && (kk 一 1) 清 除 kk 的 最 后 一 个 1。 
(2) num 十 十 。 
(3) 继续 上 述 操作 ,直到 kk 二 0。 
在 树 状 数组 中 也 有 一 个 类 似 的 操作 一 一 lowbit(z) 一 z & 一 x, 功能 是 计算 z 的 二 进 制 
数 的 最 后 一 个 1 。 
下 面 的 程序 在 子 集 生成 程序 的 基础 上 实现 了 问题 4. 3 的 要 求 : 


#include <bits/stdc++.h> 
using namespace std; 
void print set(int n, int k){ 
for(int i = 0; i<(1<<n); i++){ 


int num = 0, kk = i; //nun 统计 i 中 1 的 个 数 ;kk 用 来 处 理 i 
while(kk){ 
kk = kk&(kk— 1); // 清 除 kk 中 的 最 后 一 个 1 
numt+; // 统 计 1 的 个 数 
} 
if(num == k){ // 二 进 制 数 中 的 1 有 k 个 ,符合 条 件 
for(int j = 0; j<n; j++) 
if(i& (1<<j)) 


cout << j<<""; 
cout << endl; 


’ 
上 
int main(){ 
int ny k; //n: 元 素 的 总 数量 ; k: 个 数 为 k 的 子 集 
cin> n> k; 
print_set(n,k); 


4.3 BFS 


4.3.1 BFS 和 队列 


深度 优先 搜索 (Depth-First Search,DFS) 和 广度 优先 搜索 (Breadth-First Search, BFS， 
或 称 为 宽度 优先 搜索 ) 是 基本 的 暴力 技术 ,常用 于 解决 图 、 树 的 遍历 问题 。 

首先 考虑 算法 思路 。 以 老鼠 走 迷 富 为 例 ,这 是 DFS 和 BFS 在 现实 中 的 模型 。 迷 宫 内 
部 的 路 错综复杂 ,老鼠 从 入 口 进去 后 怎么 才能 找到 出 口 ? 有 两 种 不 同 的 方法 : 
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(1) 一 只 老鼠 走 迷 宫 。 它 在 每 个 路 口 都 选择 先 走 右边 (当然 ,选择 先 走 左 边 也 可 以 ) ,能 
走 多 远 就 走 多 远 , 直 到 碰壁 无 法 继续 往 前 走 , 然 后 回 退 一 步 ,这 一 次 走 左边 ,接着 继续 往 下 
走 。 用 这 个 办 法 能 走 遍 所 有 的 路 ,而且 不 会 重复 (这 里 规定 回 退 不 算 重 复 走 )。 这 个 思路 就 
是 DFS。 

(2) 一 群 老鼠 走 迷 宫 。 假 设 老 鼠 是 无 限 多 的 ,这 群 老鼠 进去 后 ,在 每 个 路 口 派出 部 分 老 
鼠 探 索 所 有 没 走 过 的 路 。 走 某 条 路 的 老鼠 ,如 果 碰 壁 无 法 前 行 ,就 停 下 ; 如 果 到 达 的 路 口 已 
经 有 其 他 老鼠 探索 过 了 ,也 停 下 。 很 显然 ,所 有 的 道路 都 会 走 到 ,而 且 不 会 重复 。 这 个 思路 
就 是 BFS。BFS 看 起 来 像 “ 并 行 计算 ”, 不 过 ,由 于 程序 是 单机 顺序 运行 的 ,所 以 可 以 把 BFS 
看 成 是 并 行 计算 的 模拟 。 

在 具体 编程 时 ,一 般 用 队列 这 种 数据 结构 来 具体 实现 BFS, 甚 至 可 以 说 “BFS 一 队列 ”; 
对 于 DFS, 也 可 以 说 “DFS= 递 归 ”, 因 为 用 递归 实现 DFS 是 最 普遍 的 。DFS 也 可 以 用 “ 栈 ” 
这 种 数据 结构 来 直接 实现 , 栈 和 递归 在 算法 思想 上 是 一 致 的 。 

下 面 用 一 个 图 遍历 的 题目 来 介绍 BFS 和 队列 。 


hdu 1312 “Red and Black” 

有 一 个 长 方形 的 房间 , 铺 着 方形 瓷砖 ,瓷砖 为 红色 或 黑色 。 一 个 人 站 在 黑色 瓷砖 
上 ,他 可 以 按 上 、 下 \ 左 \ 右 方向 移动 到 相 邻 的 瓷砖 。 但 他 不 能 在 红色 瓷砖 上 移动 ,只 能 
在 黑色 瓷砖 上 移动 。 编 程 计算 他 可 以 到 达 的 黑色 瓷砖 的 数量 。 

输入 : 第 1 行 包 含 两 个 正 整 数 W 和 电 ,W 和 是 分 别 表 示 X 方 向 和 y 方向 上 的 瓷砖 
数量 。W 和 是 均 不 超过 20。 下 面 有 是 行 ,每 行 包含 W 个 字符 。 每 个 字符 表示 一 片 次 
砖 的 颜色 。 用 符号 表示 如 下 :“。” 表 示 黑 色 瓷 砖 ;“ 间 ”表示 红色 瓷砖 ;“@” 代 表 黑 色 资 
砖 上 的 人 ,在 数据 集中 只 出 现 一 次 。 

输出 : 一 个 数字 ,这 个 人 从 初始 瓷砖 能 到 达 的 瓷砖 总 数量 (包括 起 点 )。 


这 个 题目 跟 老 鼠 走 迷宫 差不多 :“#” 相 当 于 不 能 走 的 陷阱 或 墙壁 ,“。" 是 可 以 走 的 路 。 
下 面 按 “ 一 群 老鼠 走 迷 宫 ” 的 思路 编程 。 

要 遍历 所 有 可 能 的 点 ,可 以 这 样 走 : 从 起 点 1 出 发 , 走 到 它 所 有 的 邻居 2、3; 逐一 处 理 
每 个 邻居 ,例如 在 邻居 2 上 ,再 走 它 的 所 有 邻居 4、5、6; 继续 以 上 过 程 ,直到 所 有 点 都 被 走 
到 ,如 图 4.1 所 示 。 这 是 一 个 “扩散 ”的 过 程 ,如 果 把 搜索 空间 看 成 一 个 池塘 , 丢 一 颗 石头 到 
起 点 位 置 , 激 起 的 波浪 会 一 层 层 扩散 到 整个 空间 。 需 要 注意 的 是 ,扩散 按 从 近 到 远 的 顺序 进 
行 ,因此 ,从 每 个 被 扩散 到 的 点 到 起 点 的 路 径 都 是 最 短 的 。 这 个 特征 对 解决 迷宫 这 样 的 最 短 
路 径 问 题 很 有 用 。 

用 队列 来 处 理 这 个 扩散 过 程 非常 清晰 、 易 懂 , 对 照 图 4.1: 

(a) 1 进 队 。 当 前 队列 是 {1)。 

(b) 1 出 队 ,1 的 邻居 2、3 进 队 。 当 前 队列 是 {2,3}( 可 以 理解 为 从 1 扩散 到 2、3)。 

(c) 2 出 队 ,2 的 邻居 4.5、6 进 队 。 当 前 队列 是 {3,4,5,6} (可 以 理解 为 从 2 扩散 到 4、 
Bb, 

(d) 3 出 队 ,7、8 进 队 。 当 前 队列 是 {4,5,6,7,8}( 可 以 理解 为 从 3 扩散 到 7、8)。 

(e) 4 出 队 ,9 进 队 。 当 前 队列 是 {5,6,7,8,9}。 
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. . . . # . . . . # . EE . . # 
2 4 全 6 

. . . ® ®。 . . . . et ee . . 
1 Tz 3 1 3 

# @ 。 ® 。 # @—e . . # @--e . . 

@ # @。 e。 # ® # © 。 # .© # ® 。 # 


(a) 1 进 队 (b) 1 出 队 ; 2、3 进 队 (ce) 2 出 队 ; 4、5、6 进 队 
. 部 @ 。 # 2 EE ® 。 # 2 i 起 # # 
4 2 6 人 2 6 4 2611 
人 和 . 全 0-—® . . . .® 9 人 . 

va 种 R 5 1 3 7 站 | 
# @--e—>e ee # = 人 . # @ 。 ee ee 
. # B . # . # 2 . # . # 2 站 # 
(d) 3 出 队 ; 7、8 进 队 (e) 4 出 队 ; 9 进 队 (k) 最 后 结果 


(人 5 出 队 ,10 进 队 。 当 前 队列 


图 4.1 BFS 过 程 


是 (6573859510}: 


(g) 6 出 队 ,11 进 队 。 当 前 队列 是 {7,8,9,10,11)。 


(h) 7 出 队 ,12、13 进 队 。 当 前 队列 是 {8,9,10,11,12,13})。 


(iD 8,9 出 队 ,10 出 队 ,14 进 队 。 当 前 队列 是 {11,12,13,14}。 
(0j) 11 出 队 ,15 进 队 。 当 前 队列 是 {12,13,14,15)。 
(k) 12、13、14、15 出 队 。 当 前 队列 是 空 {} ,结束 。 


hdu 1312 题 的 BFS 程序 


#include < bits/stdc++.h> 
using namespace std; 
char room[23][23]; 
int dir[4][2] = { 
{~-1,0}, 
{0, =1}, 
{1,0}, 
{0,1} 
}; 
int Wx, Hy, num; 
#define CHECK(x, y) (x<Wx && x> 
struct node {int x, y;}; 
void BFS(int dx, int dy){ 
num= 1; 
queue <node> q; 
node start, next; 
start.x = dx; 
start.y = dy; 
q. push( start); 
while(!q.empty()) { 
start = q.front(); 


// 向 左 .左上 角 的 坐标 是 (0,0) 


// 向 上 
// 向 右 
// 向 下 


//Wx 行 ,Hy 列 .用 num 统计 可 走 的 位 置 有 多 少 


=0 g& y>=0 && y<Hy) 


// 是 否 在 room 中 


// 起 点 也 包含 在 砖 块 内 


// 队 列 中 放 坐 标点 


q. pop(); 


//cout <<"out"<< start. x << start. y << endl; 


for(int i=0; i<4; i++) { 


next.x = start.x + dir[i][0]; 
next.y = start.y + dir[i][1]; 
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// 打 印 出 队列 情况 ,进行 验证 
// 按 左上 、 右 、 下 4 个 方向 顺 时 针 逐 一 搜索 


if(CHECK(next. x, next. y) && room[ next.x][next.y] == ".') { 


room[next.x][next.y] = '#"; 


num++; 


q. push(next); 


| 
} 
int main(){ 
It hy 
while (cin >> Wx >> Hy) { 
if (Wx==0 g&& Hy==0) 
break; 
for (y = 0; y<Hy; yt+) { 
for (x = 0; x< Wx; x+t+) { 
cin >> room[x][y]; 
证 (room[x][Y] == '@') { 
dx = x; 
dy = y; 


} 
} 
num = 0; 
BFS(dx, dy); 
cout << num << endl; 
} 


return 0; 


// 进 队 之 后 标记 为 已 经 处 理 过 


//Wx 行 ,Hy 列 
// 结 束 


// 有 了 7y 列 
// 一 次 读 人 一 行 


// 读 入 起 点 


【习题 】 


poj 3278 “Catch That Cow”。 
poj 1426 “Find The Multiple” 。 
poj 3126 “Prime Path”。 

poj 3414 “Pots”。 

hdu 1240 “Asteroids!”。 

hdu 4460 “Friend Chains”。 


4.3.2 八 数码 问题 和 状态 图 搜索 


BFS 搜索 处 理 的 对 象 不 仅 可 以 是 一 个 数 ,还 可 以 是 一 种 “状态 ”。 八 数码 问题 是 典型 的 


状态 图 搜索 问题 。 
。46 。 


第 4 章 搜索 技术 


1. 八 数码 问题 

在 一 个 3X3 的 棋盘 上 放置 编号 为 1~8 的 8 个 方块 ,每 个 占 一 格 ,另外 还 有 一 个 空格 。 
与 空格 相 邻 的 数字 方块 可 以 移动 到 空格 里 。 任 务 1: 指定 初始 棋局 和 目标 棋局 (如 图 4. 2 所 
示 ) ,计算 出 最 少 的 移动 步 数 ; 任务 2: 输出 数码 的 移动 序列 。 

把 空格 看 成 0, 一 共有 9 个 数字 。 


2 有 1 3 
输入 样 例 : | 
123084765 党 | 陡 ， 和 | 入 目光 
6 | 访 | 六 了 | 二 | 5 
出 样 例 : 
os 图 4.2 初始 棋局 和 目标 棋局 


把 一 个 棋局 看 成 一 个 状态 图 ,总 共有 91 二 362 880 个 状态 。 从 初始 棋局 开始 ,每 次 移动 
转 到 下 一 个 状态 ,到 达 目 标 棋局 后 停止 。 

八 数码 问题 是 一 个 经 典 的 BFS 问题 。 前 面 章节 中 提 到 BFS 是 从 近 到 远 的 扩散 过 程 , 适 
合 解 决 最 短 距离 问题 。 八 数码 从 初始 状态 出 发 ,每 次 转移 都 逐步 表 近 目标 状态 。 每 转移 一 
次 , 步 数 加 一 , 当 到 达 目 标 时 ,经 过 的 步 数 就 是 最 短路 径 。 

图 4. 3 是 样 例 的 转移 过 程 。 该 图 中 起 点 为 (A, 0) ,A 表示 状态 , 即 {(123084765} 这 
个 棋局 ; 0 是 距离 起 点 的 步 数 。 从 初始 状态 A 出 发 ,移动 数字 0 到 邻居 位 置 , 按 左 、 上 、 右 、 
下 的 顺 时 针 顺 序 , 有 3 个 转移 状态 B.C、D; 目标 状态 是 下 ,停止 。 

(4,0) 
1 2 3 


0 4 
学 5 


图 4.3 八 数码 问题 的 搜索 树 


用 队列 描述 这 个 BFS 过 程 : 

(1) A 进 队 ,当前 队列 是 {A}); 

(2) A 出 队 ,A 的 邻居 B、C、D 进 队 ,当前 队列 是 {B, C, DD} , 步 数 为 1; 
(3) B 出 队 ,E 进 队 , 当 前 队列 是 {C, D, E),E 的 步 数 为 2; 

(4) C 出 队 , 转 移 到 下 ,检验 下 是 目标 状态 ,停止 ,输出 下 的 步 数 2。 


i 
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仔细 分 析 上 述 过 程 ,发 现 从 B 状态 出 发 实际 上 及 、X 两 个 转移 方向 ,而 X 正好 是 初始 
状态 A ,重复 了 。 同 理 Y 状态 也 是 重复 的 。 如 果 不 去 掉 这 些 重复 的 状态 ,程序 会 产生 很 多 
无 效 操作 ,复杂 度 大 大 增加 。 因 此 , 八 数码 的 重要 问题 其 实 是 判 重 。 

如 果 用 暴力 的 方法 判 重 , 每 次 把 新 状态 与 9! 王 362 880 个 状态 对 比 , 可 能 有 91X91! 次 检 
查 , 不 可 行 。 因 此 需要 一 个 快速 的 判 重 方法 。 

本 题 可 以 用 数学 方法 “ 康 托 展开 (Cantor Expansion)” 来 判 重 。 

2. 康 托 展开 

康 托 展开 是 一 种 特殊 的 哈 希 函数 。 在 本 题 中 , 康 托 展开 完成 了 如 表 4. 2 所 示 的 工作 : 

表 4.2 ”本题 中 康 托 展开 完成 的 工作 


状 态 012345678 012345687 012345768 012345786 pa 876543210 


Cantor 0 1 2 3 i 362 880 一 1 


第 1 行 是 0~8 这 9 个 数字 的 全 排列 , 共 9!=362 880 个 , 按 从 小 到 大 排序 。 第 2 行 是 每 
个 排列 对 应 的 位 置 ,例如 最 小 的 {012345678}) 在 第 0 个 位 置 ,最 大 的 {876543210}) 在 最 后 的 
362 880 一 1 这 个 位 置 。 

函数 Cantor() 实 现 的 功能 是 : 输入 一 个 排列 , 即 第 1 行 的 某 个 排列 ,计算 出 它 的 Cantor 
值 , 即 第 2 行 对 应 的 数 。 

Cantor() 的 复杂 度 为 O(n?),n 是 集合 中 元 素 的 个 数 。 在 本 题 中 ,完成 搜索 和 判 重 的 总 
复杂 度 是 O(n1m), 远 比 用 暴力 判 重 的 总 复杂 度 O(n1n1) 小 。 

有 了 这 个 函数 , 八 数码 的 程序 能 很 快 判 重 : 每 转移 到 一 个 新 状态 ,就 用 Cantor() 判 断 这 
个 状态 是 否 处 理 过 ,如 果 处 理 过 , 则 不 转移 。 

下 面 举 例 讲解 康 托 展开 的 原理 。 

例子 : 判断 2143 是 {1, 2, 3, 4} 的 全 排列 中 第 几 大 的 数 。 

计算 排 在 2143 前 面 的 排列 数目 ,可 以 将 问题 转换 为 以 下 排列 的 和 : 

(1) 首位 小 于 2 的 所 有 排列 。 比 2 小 的 只 有 1 一 个 数 .后 面 3 个 数 的 排列 有 3X2X1= 
3! 个 ( 即 1234、1243、1324、1342、1423、1432) ,写成 1X3! 一 6。 

(2) 首位 为 2、 第 2 位 小 于 1 的 所 有 排列 。 无 ,写成 0X2!1=0。 

(3) 前 两 位 为 21 ,第 3 位 小 于 4 的 所 有 排列 。 只 有 3 一 个 数 ( 即 2134) ,写成 1X1!=1。 

(4) 前 3 位 为 214、 第 4 位 小 于 3 的 所 有 排列 。 无 ,写成 0X0!=0。 

求 和 : 1X31 十 0X21 十 1X1! 十 0X01=7, 所 以 2143 是 第 8 大 的 数 。 如 果 用 int visited[24] 
数组 记录 各 排列 的 位 置 ,{2143} 就 是 visited[7]; 第 一 次 访问 这 个 排列 时 , 置 visited[7]==1; 
当 再 次 访问 这 个 排列 的 时 候 发 现 visited[7] 等 于 1, 说明 已 经 处 理 过 , 判 重 。 

根据 上 面 的 例子 得 到 康 托 展开 公 

把 一 个 集合 产生 的 全 排列 按 字典 序 排序 ,第 X 个 排列 的 计算 公式 如 下 : 

X=a[nj Xn—1)1+taln—1]X(n—2)1++*…+ta[i] x 
(Gi 一 1)! 十 … 十 ec[2]X1! 十 a[1]X0o![C1] 
其 中 ,a[ 世 为 当前 未 出 现 的 元 素 排 在 第 几 个 (从 0 开始 ) ,并 且 有 0a[i]<<i (i<n)。 
上 述 过 程 的 反 过 程 是 康 托 逆 展开 : 某 个 集合 的 全 排列 ,输入 一 个 数字 ,返回 第 大 的 
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排列 。 
下 面 的 程序 用 “BFS 十 Cantor” 解 决 了 八 数码 问题 ,其 中 BFS 用 STL 的 queue 实现 了 。 


#include < bits/stdc++.h> 

const int LEN = 362880; // 状 态 共 9!= 362 880 种 

using namespace std; 

struct node{ 
int state[9]; // 记 录 一 个 八 数码 的 排列 , 即 一 个 状态 
int dis; // 记 录 到 起 点 的 距离 

Wi 


int dir[4][2] = {{-—1,0}, {0,—1},{1,0},{0,1}}; 
// 左 .上 、 右 、 下 顺 时 针 方向 .左上 角 的 坐标 是 (0,0) 


int visited[ LEN] = {0}; // 与 每 个 状态 对 应 的 记录 , Cantor( ) 函数 对 它 置 数 ,并 判 重 
int start[9]; // 开 始 状 态 
int goal[9]; // 目 标 状态 
long int factory[] = {1,1,2,6,24,120,720,5040,40320,362880}; 
//Cantor( ) 用 到 的 常数 


bool Cantor(int str[], int n) { // 用 康 托 展开 判 重 
long result = 0; 
Sor(tint 1 = OF dc<n; +) { 
int counted = 0; 
for(intj = i+1; j<n; j++) { 
if(str[i] > str[j]) ”// 当 前 未 出 现 的 元 素 排 在 第 几 个 
++counted; 
} 
result += counted* factory[n— i-1]; 
} 
if(!visited[result]) { // 没 有 被 访问 过 
visited[result] = 1; 
return 1; 
Ll 
else 
return 0; 
} 
int bfs() { 
node head; 
memcpy(head. state, start, sizeof(head. state)); // 复 制 起 点 的 状态 
head. dis = 0; 


queue <node> q; // 队 列 中 的 内 容 是 记录 状态 
Cantor(head. state, 9); // 用 康 托 展开 判 重 , 目 的 是 对 起 点 的 visited[ ] 赋 初 值 
q. push(head); // 第 一 个 进 队 列 的 是 起 点 状态 
while(!q.empty()) { // 处 理 队 列 
head = q.front(); 
q. pop(); // 可 在 此 处 打印 head. state, 看 弹出 队列 的 情况 


int z; 
for(z = 0; z<9; z++) // 找 这 个 状态 中 元 素 0 的 位 置 
if(head. state[z] == 0)// 找 到 了 


@@ ”本题 中 的 队列 比较 简单 ,如 果 不 用 STL, 也 可 以 用 简单 的 方法 模拟 队列 ,请 搜索 网 上 的 代码 。 
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break; 
// 转 化 为 二 维 ,左上 角 是 原点 (0,0) 
intx= z%3; // 横 坐标 
inty = z/3; // 纵 坐标 
for(int i = 0; i<4; i++){ // 上 下、 左右 最 多 可 能 有 4 个 新 状态 
int newx = x+dir[i][0]; // 元 素 0 转移 后 的 新 坐标 
int newy = y+ dir[i][1]; 
int nz = newx + 3*x newy; // 转 化 为 一 维 


if(newx>=0 && newx<3 && newy>=0 && newy<3) {  // 未 越界 
node newnode; 
memcpy( Enewnode, &head, sizeof (struct node) ); // 复 制 这 新 的 状态 
swap(newnode. state[z], newnode. state[nz]); // 把 0 移动 到 新 的 位 置 


newnode. dis ++; 


if(memcmp(newnode. state, goal, sizeof(goal)) == 0) 
// 与 目标 状态 对 比 
return newnode. dis; // 到 达 目 标 状态 ,返回 距离 ,结束 
if(Cantor(newnode. state, 9)) // 用 康 托 展开 判 重 
q. push( newnode); // 把 新 的 状态 放 进 队列 
} 
} 
} 
return -1; // 没 找到 


} 

int main(){ 
for(int i = 0; i<9; i++) cin>> start[i];  // 初 始 状 态 
for(int i = 0; i<9; i++) cin>> goal[i]; // 目 标 状态 
int num = bfs(); 


if(num != 一 1) cout << num << endl; 
else cout << "Impossible" << endl; 
return 0; 


} 


上 述 代码 的 细节 很 多 ,请 读者 仔细 体会 ,要 求 能 独立 写 出 来 。 
15 数码 问题 。 八 数码 问题 只 有 9! 种 状态 ,对 于 更 大 的 问题 ,例如 4X4 棋盘 的 15 数码 问 
题 ,有 16! ~ 2X10* 种 状态 ,如 果 仍 然 用 数组 存储 状态 , 远 远 不 够 ,此 时 需要 更 好 的 算法 ?。 


【习题 】 
poj 1077“Eight”, 八 数码 问题 。 另 外 ,在 学 过 下 一 节 的 A* 算法 后 可 重新 做 这 道 题 。 
4.3.3 BFS 与 A* 算 法 


1. 用 BFS 求 最 短路 径 


最 短路 径 是 图 论 的 一 个 基本 问题 ,有 很 多 复杂 的 算法 。 不 过 ,在 特殊 的 地 图 中 ,BFS 也 
是 很 好 的 最 短路 径 算法 。 下 面 仍然 以 hdu 1312"Red and Black" 的 方 格 图 为 例 , 任 务 是 求 两 
点 之 间 的 最 短路 径 。 


@ 八 数码 的 多 种 解法 ,例如 双向 广 搜 、A * 、IDA * 等 ,请 参考 “https://www. cnblogs. com/zufezzt/p/5659276. 
html”( 永 久 网 址 : perma. cc/YV2V-GT6C)。 
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在 图 4.4 中 , 黑 点 *。” 表 示 可 以 走 的 路 ,“# ”表示 不 能 走 。 求 起 点 “@” 到 所 有 黑 点 “。” 
的 最 短 距离 。 


oo。 。 oi# 0 0。 。 。# Ee 
. . . . . 《一 和 一》 人 . . 2 el! ° | 及 
# 加 ee。。 # QIe ye 。 轩 避 代 这 浊 
ee # e ee # 而 - 关注 -二 四 
(a) 迷宫 图 (b) BFS 过 程 (0) 最 短 距 离 


图 4.4 用 BFS 找 最 短路 径 


方法 很 简单 ,从 “@” 出 发 ,用 BFS 搜索 所 有 点 ,记录 到 达 每 个 点 时 经 过 的 步 数 , 即 可 得 
到 从 “@” 到 所 有 黑 点 的 最 短 距离 .图 4. 4(c) 标 出 了 结果 。 

在 这 个 例子 中 ,BFS 搜 最 短路 径 的 计算 复杂 度 是 O(V 十 E) ,非常 好 。 

这 个 例子 很 特殊 ,图 是 方 格 形 的 , 相 邻 两 点 之 间 的 距离 相同 。 也 就 是 说 , 绕 路 肯定 更 远 ; 
BFS 先 扩 展 到 的 路 径 ,距离 肯 定 是 最 短 的 。 

如 果 相 邻 点 的 距离 不 同 , 绕 路 可 能 更 近 ,BFS 就 不 适用 了 。 关 于 最 短路 径 的 通用 算法 ， 
请 阅读 本 书 的 10. 9 节 的 内 容 。 

下 面 的 A* 算 法 是 BFS 的 优化 。 

2. Ax* 算法 与 最 短路 径 

BFS 是 一 种 “盲目 的 ”搜索 技术 , 它 在 搜索 的 过 程 中 并 不 理会 目标 在 哪里 ,只 顾 自己 乱 
走 ,当然 最 后 总 会 到 达 终 点 。 

稍微 改变 hdu 1312 的 方 格 图 , 见 图 4. 5(a) ,现在 的 任务 是 求 起 点 “@” 到 终点 ”的 最 短路 径 。 


® ©® ©。® 。 # .© ©® ©。® 。 # . é .® 。 # . 6 .® 。 # 
3 5 个 2 5 个 : | 
. @ ©。 。 1 ® 。 。 。 1 ee。 。 1 et ee。 。 1 
3 1 ，.: 1 ， 下 中 
# 四 。 。 . # @® 。 . # 四 一 e 一 。 . # @oe > 
.0 # ee 。e # ®e # ee ee # e # 和 . # ee # 4 J # 
(a) 起 点 和 终点 (b) 第 1 轮 搜索 (c) 第 2 轮 搜索 (d) 最 短 距离 
图 4.5 启发 式 搜索 


如 果 仍 然 用 BFS 求解 ,程序 会 搜索 所 有 的 点 ,直到 过 到 1 点。 不 过 ,如 果 让 一 个 人 走 这 
个 图 ,他 会 一 眼看 出 向 右上 方 走 可 以 更 快 地 找到 到 达 : 的 最 短路 径 。 人 有 “智能 ,那么 能 否 
把 这 种 智能 教 给 程序 呢 ? 这 就 是 “启发 式 ” 搜 索 算法 。 启 发 式 搜索 算法 有 很 多 种 ,A * 算法 
是 其 中 比较 简单 的 一 种 。 

简单 地 说 ,A * 算法 是 "BFS 十 贪心 "2。 有 关 贪心 法 的 解释 ,请 阅读 本 书 的 6.1 节 。 

在 图 4.5(a) 中 ,程序 如 何 知道 向 右上 方 走 能 更 快 地 到 达 1? 这 里 引入 曼哈顿 距离 的 概 
念 。 曼 哈 顿 距离 是 指 两 个 点 在 标准 坐标 系 上 的 实际 距离 ,在 图 4. 5 中 就 是 @ 的 坐标 和 + 的 


中 ”这 个 网 页 用 动画 演示 了 BFS、A * .Dijkstra 算法 的 原理 ,并 给 出 了 比较 详细 的 伪 代 码 描述 ,非常 值得 一 看 ,网 址 为 
https://www. redblobgames. com/ pathfinding/a-star/introduction. html( 永 久 网 址 : https://perma. cc/N2DB-5LDY) 。 
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坐标 在 横向 和 纵向 的 距离 之 和 , 它 也 被 形象 地 称 为 “出 租车 距离 ”。 
图 4.5(b) 是 从 起 点 开始 的 第 1 轮 BFS 搜索 ,邻居 点 上 标注 的 数字 3 是 这 个 点 到 终点 上 
罗曼 哈 顿 距离 。 图 4. 5(c) 是 第 2 轮 搜索 ,标注 2 的 点 是 离 终点 更 近 的 点 ,从 这 些 点 继续 搜 
索 ; 标注 4 和 5 的 点 距离 终点 远 , 先 暂 时 停止 搜索 。 经 过 多 轮 搜索 ,最 后 到 达 了 终点 1, 如 
图 4.5(d) 所 示 。 

在 这 个 过 程 中 ,图 中 很 多 “不 好 的 ”点 并 不 需要 搜索 到 ,从 而 优化 了 搜索 过 程 。 

上 面 的 图 例 比较 简单 ,如 果 起 点 和 终点 之 间 有 很 多 障碍 ,搜索 范围 也 会 沿 着 障碍 忽 圈 
子 , 之 后 才能 到 达 终 点 ,不 过 ,仍然 有 很 多 点 不 需要 搜索 。 以 下 面 的 图 4. 6 为 例 ,A 是 起 点 ， 
B 是 终点 ,黑色 方块 是 障碍 , 浅 色 阴 影 方 块 是 用 曼哈顿 距离 进行 启发 式 搜索 所 经 过 的 部 分 ， 
其 他 无 色 方块 是 不 需要 搜索 的 。 搜 索 结束 后 ,得 到 一 条 最 短路 径 , 见 图 中 的 虚线 。 

0 这 个 方法 就 是 A* 算法 ,下 面 给 出 它 的 一 


在 搜索 过 程 中 ,用 一 个 评估 函数 对 当前 情 
tear。 况 进 行 评估 ,得 到 最 好 的 状态 ,从 这 个 状态 继续 
视频 讲解 搜索 ,直到 目标 。 设 zx 是 当前 所 在 的 状态 ， 
f(z) 是 对 工 的 评估 函数 ,有 : 
f(z)=g(7z)+h(z) 
国生 6 个， 扩 过 水 本 得 贞 生 g(z) 表 示 从 初始 状态 到 z 的 实际 代价 , 它 不 体现 x 和 终 
点 的 关系 。 

h(z) 表 示 z 到 终点 的 最 优 路 径 的 评估 , 它 就 是 “启发 式 ”信息 , 把 h(z) 称 为 启发 函数 。 
很 显然 ,h(xz) 决 定 了 A * 算 法 的 优 劣 。 

特别 需要 注意 的 是 ,h(z) 不 能 漏 掉 最 优 解 。 

在 上 面 的 例子 中 ,曼哈顿 距离 就 是 启发 函数 h(x)。 曼 哈 顿 距离 是 一 种 简单 而 且 常 用 的 
启发 函数 。 

在 上 面 这 个 例子 中 ,可 以 看 出 A * 算 法 包含 了 BFS 和 贪心 算法 。 

(1) 如 果 PCz)=0, 有 f(x) 二 g(x) ,就 是 普通 的 BFS 算法 ,会 访问 大 量 的 方块 。 

(2) 如 果 gCz) 王 0, 有 f(z) 二 h(x), 就 是 贪心 算法 ,此 时 图 中 标注 ** ”的 方块 也 会 被 访 
问 到 。 贪 心 法 的 缺点 是 可 能 陷 在 局 部 最 优 中 ,例如 陷 在 * * ”的 方块 中 ,被 堵 在 障碍 后 面 ,无 
法 到 达 终 点 。 

3. A* 算法 与 八 数码 问题 

八 数码 问题 也 可 以 用 A * 算法 进行 优化 。 通 常 考虑 3 种 估价 函数 : 

(1) 以 不 在 目标 位 置 的 数码 的 个 数 作为 估价 函数 。 

(2) 以 不 在 目标 位 置 的 数码 与 目标 位 置 的 曼哈顿 距离 作为 估价 函数 。 

(3) 以 道 序数 "作为 估价 函数 。 

第 (2) 种 比 第 (1) 种 好 ,可 作为 八 数码 问题 的 估价 函数 。 


4.3.4 双向 广 搜 
双向 广 搜 是 BFS 的 增强 版 。 


@ 逆序 数 可 以 用 来 判断 八 数码 是 否 有 解 。 
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前 面 提 到 ,可 以 把 BFS 想象 成 在 一 个 平静 的 池塘 丢 一 颗 石 头 , 激 起 的 波浪 一 层 层 扩散 
到 整个 空间 ,直到 到 达 目 标 ,就 得 到 了 从 起 点 到 目标 点 的 最 优 路 径 。 那 么 ,如 果 同 时 在 起 点 
和 目标 点 向 对 方 做 BFS, 两 个 石头 激 起 的 波浪 向 对 方 扩 散 ,将 在 中 间 的 某 个 位 置 遇 到 ,此 时 
即 得 到 了 最 优 路 径 。 在 绝 大 多 数 情况 下 ,双向 广 搜 比 只 做 一 次 BFS 搜索 的 空间 要 少 很 多 ， 


从 而 更 有 效率 。 
从 上 面 的 描述 可 知 , 双 向 广 搜 的 应 用 场合 是 知道 起 点 和 终点 ,并且 正 向 和 逆向 都 能 进行 
搜索 。 


下 面 是 一 个 典型 的 双向 广 搜 问题 。 


hdu 1401“Solitaire” 
有 一 个 8X8 的 棋盘 ,上 面 有 4 颗 棋子 ,棋子 可 以 上 下 左右 移动 。 给 定 一 个 初始 状态 
和 一 个 目标 状态 , 问 能 否 在 8 步 之 内 到 达 。 


题目 确定 了 起 点 和 终点 ,十 分 适合 双向 BFS。 要 求 在 8 步 之 内 到 达 , 可 以 从 起 点 和 终点 
分 别 开 始 ,各 自 广 搜 4 步 , 如 果 出 现 交 点 则 说 明 可 达 。 读 者 可 以 练习 此 题 ,虽然 程序 比较 烦 
琐 , 有 很 多 细节 需要 处 理 ,但 是 难度 不 高 。 

4. 3. 2 节 讲 解 的 八 数码 问题 也 非常 适合 使 用 双向 广 搜 技术 进行 优化 。 


【习题 】 


hdu 1401“Solitaire”; 
hdu 3567“Eight 11”, 用 双向 广 搜 解决 八 数码 问题 。 


4.4 DFS 


4.4.1 DFS 和 递归 


hdu 1312 题 有 另外 一 种 解决 方案 , 即 4. 3. 1 节 中 提 到 的 “一 只 老鼠 走 迷 宫 ”。 设 num 是 
到 达 的 砖 块 数量 ,算法 过 程 描述 如 下 : 

(1) 在 初始 位 置 令 num 一 1, 标 记 这 个 位 置 已 经 走 过 。 

(2) 左 ` 上 \ 右 、 下 4 个 方向 , 按 顺 时 针 顺 序 选 一 个 能 走 的 方向 , 走 一 步 。 

(3) 在 新 的 位 置 num 十 十 ,标记 这 个 位 置 已 经 走 过 。 

(4) 继续 前 进 , 如 果 无 路 可 走 , 回 退 到 上 一 步 , 换 个 方向 再 走 。 


(5) 继续 以 上 过 程 ,直到 结束 。 和 

在 以 上 过 程 中 ,能 够 访问 到 所 有 合法 的 砖 块 ,并 且 每 个 砖 块 只 | 9 |s ,3 

访问 一 次 ,不 会 重复 访问 ( 回 退 不 算 重复 ) ,如 图 4.7 所 示 。 a bh lo 
hdu 1312 的 路 线 如 下 : 从 1 到 13, 能 一 直 走 下 去 。 在 13 这 个 Is 14 

. # ee # 


位 置 ,到 底 了 不 能 再 走 , 按 顺序 回 退 到 12、11; 在 11 这 个 位 置 , 换 
个 方向 又 能 走 到 14、15。 到 达 15 后 ,发 现 不 能 再 走 下 去 ,那么 按 顺 图 4.7 DFS 过 程 
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序 倒退 , 即 14-11-10 一 9 一 8 一 7 一 6 一 5 一 4 一 3 一 2 一 1, 在 这 个 过 程 中 发 现 全 部 都 没有 新 
路 ,最 后 退回 到 起 点 ,结束 。 

为 加 深 对 递归 的 理解 ,这 里 再 次 给 出 递归 返回 的 完整 顺序 , 即 13 一 12 一 15 一 14 一 11 一 ~ 
10 一 9 一 8 一 7 一 6 一 5 一 4-~3 一 2 一 1 。 

在 这 个 过 程 中 ,最 重要 的 特点 是 在 一 个 位 置 只 要 有 路 ,就 一 直 走 到 最 深 处 ,直到 无 路 可 
走 , 再 退回 一 步 ,看 在 上 一 步 的 位 置 能 不 能 换个 方向 继续 往 下 走 。 这 样 就 遍历 了 所 有 可 能 走 
到 的 位 置 。 

这 个 思路 就 是 深度 搜索 。 从 初始 状态 出 发 ,下 一 步 可 能 有 多 种 状态 ; 选 其 中 一 个 状态 
深入 ,到 达 新 的 状态 ; 直到 无 法 继续 深入 , 回 退 到 前 一 步 ,转移 到 其 他 状态 ,然后 再 深入 下 
去 。 最 后 ,遍历 完 所 有 可 以 到 达 的 状态 ,并 得 到 最 终 的 解 。 

上 述 过 程 用 DFS 实现 是 最 简单 的 ,代码 比 BFS 短 很 多 。 

下 面 是 代码 。 读 者 可 以 在 DFS() 函 数 中 打印 走 过 的 位 置 以 及 回 退 的 情况 。 从 打印 的 
信息 可 以 看 出 ,在 到 达 15 后 ,程序 确实 是 逐步 回 退 到 起 点 的 。 


// 用 DFS() 蔡 换 4.3.1 节 程 序 中 的 BFS(), 并 在 main() 中 的 相同 位 置 调用 它 
void DFS(int dx，int dy){ 


room[dx][dy] = '#°'; // 标 记 这 个 位 置 ,表示 已 经 走 过 

//cout <<"walk:"<< dx << dy << endl; // 在 此 处 打印 走 过 的 位 置 , 验证 是 否 符合 
num+t+; 
for(int i = 0; i<4; i++)1{ // 左 上、 右 、 下 4 个 方向 顺 时针 深 搜 


int newx = dx + dir[i][0]; 
int newy = dy + dir[i][1]; 
if(CHECK(newx, newy) && room[ newx][newy] == '.'){ 
DFS(newx, newy); 
//cout <<" back:"<< dx << dy << endl; 
// 在 此 处 打印 回 退 的 点 的 坐标 ,观察 深 搜 到 底 后 回 退 的 情况 
// 例 如 到 达 最 后 的 15 这 个 位 置 后 会 一 直 退 到 起 点 
// 即 打印 出 14-11-10-9-8-7-6-5-4-3-2-1. 这 也 是 递归 程序 返回 的 过 程 


4.4.2 回溯 与 剪 枝 


前 面 提 到 的 DFS 搜索 ,基本 的 操作 是 将 所 有 子 结 点 全 部 扩展 出 来 ,再 选取 最 新 的 一 个 
结 点 进行 扩展 。 

不 过 ,在 很 多 情况 下 ,用 递归 列举 出 所 有 的 路 径 可 能 会 因为 数量 太 大 而 超时 。 由 于 很 多 
子 结 点 是 不 符合 条 件 的 ,可 以 在 递归 的 时 候 * 看 到 不 对 头 就 撤退 ”, 中 途 停止 扩展 并 返回 。 这 
个 思路 就 是 回溯 ,在 回溯 中 用 于 减少 子 结 点 扩展 的 函数 是 剪 枝 函 数 。 

大 部 分 DFS 搜索 题目 都 需要 用 到 回溯 的 思路 ,其 难度 主要 在 于 扩展 子 结 点 的 时 候 如 何 
构造 停止 递归 并 返回 的 条 件 。 这 需要 通过 大 量 地 练习 有 关 题 目 才能 熟练 应 用 。 

八 皇 后 问题 是 经 典 的 回溯 与 剪 枝 的 应 用 。 

八 皇 后 问题 。 在 棋盘 上 放置 8 个 皇后 ,使 得 它们 不 同行 不 同 列 、 不 同 对 角 线 。N 皇后 
问题 是 八 皇 后 问题 的 扩展 。 
。54 。 


第 4 章 ”搜索 技术 


如 果 用 暴力 方法 , 先 排列 出 所 有 的 棋局 ,然后 一 一 判断 去 除非 法 的 棋局 ,请 读者 自己 思 
考 复杂 度 有 多 大 。 


下 面 以 四 皇后 问题 为 例 描述 解 题 过程 。 在 图 4. 8 中 ,从 第 1 行 开 始 放 皇 后 : 第 1 行 从 


左 到 右 有 4 种 方案 ,产生 4 个子 结 点 ; 第 2 行 , 排 除 同 列 和 斜 线 , 扩 展 新 的 子 结 点 ,注意 不 用 
排除 同行 ,因为 第 2 行 和 第 1 行 已 经 不 同行 ; 继续 扩展 第 3 行 和 第 4 行 ,结束 。 


3 
本 


于 一世 
二 二 贞 
于 


时 蔚 


图 4.8 四 皇后 问题 的 搜索 树 
该 图 用 BFS 和 DFS 都 能 实现 。 前 文 说 过 ,DFS 的 代码 比 BFS 简洁 很 多 。 下 面 用 DFS 
来 解决 。 


关键 问题 : 在 扩展 结 点 时 如 何 去 掉 不 符合 条 件 的 子 结 点 ? 


皇后 的 坐标 是 (c,r) ,它们 的 关系 如 下 : 
(1) 横向 ,不 同行 : i 才 r。 
(2) 纵向 ,不 同 列 : j 隆 ec。 


(3) 斜 对 角 : 从 人 7 向 斜 对 角 走 a 步 ,那么 新 坐标 (r,c) 有 4 种 情况 , 即 左 上 (i 一 a,j 一 a)、 


右上 (i 十 ayj 一 Q)、 左 下 (i 一 a,j 十 a)、 右 下 (i 十 a,j 十 a) ,综合 起 来 就 是 |i 一 ~| = 上 7 一 c|。 新 
皇后 的 位 置 不 能 放 在 斜 线 上 , 需 满足 |i 一 r| 关 |j 一 c|。 


下 面 是 hdu 2553 的 代码 ,求解 N 皇后 问题 ,N10。 


hdu 2553“N 皇后 问题 ” 


#include < bits/stdc++.h> 

using namespace std; 

intn tot = 0; 

int col[12] = {0}; 

bool check(int c，intr) { 
RE 

if(col[i] == c || (abs(col[i]-c) == abs(i—r))) 
return false; 


// 检 查 是 否 和 已 经 放 好 的 皇后 冲突 


// 取 绝对 值 
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return true; 


. 


void DFS(int r) { // 一 行 一 行 地 放 皇 后 ,这 一 次 是 第 r 行 
if(r == n) { // 所 有 皇后 都 放 好 了 ,递归 返回 
tot++; // 统 计 合 法 的 棋局 个 数 
return; 
} 
for(intc = 0; c<n; c++) // 在 每 一 列 放 皇 后 
证 (check(c, r)){ // 检 查 是 否 合法 
col[r] = ci; // 在 第 r 行 的 c 列 放 皇 后 
DFS(r+1); // 继 续 放下 一 行 皇后 


} 
} 
int main() { 
int ans[12] = {0}; 


for(n = 0; n<=10; nt+){ // 算 出 所 有 NN 皇 后 的 答案 . 先 打 表 , 不 然 会 超时 
memset (col, 0, sizeof (col)); // 清 空 ,准备 计算 下 一 个 N 皇 后 问题 
tot = 0; 
DFS(0); 
ans[n] = tot; // 打 表 
. 
while(cin >> n) { 
if(n==0) 
return 0; 


cout << ans[n] << endl; 


} 
return 0; 


} 


NN 皇后 问题 的 DFS 回溯 程序 非常 简单 ,关键 有 两 处 ,一 是 如 何 递归 ,二 是 如 何 剪 枝 和 回 
滴 。 在 上 述 程序 中 有 很 多 细节 ,例如 : 

(1) 打 表 。 在 main() 中 提前 算出 了 从 1 到 10 的 所 有 N 皇后 问题 的 答案 ,并 存储 在 数 
组 中 ,等 读 取 输入 后 立刻 输出 。 如 果 不 打 表 , 而 是 等 输入 N 后 再 单独 计算 输出 ,会 超时 。 

(2) 递归 搜索 DFS()。 递 归程 序 十 分 简洁 ,把 第 1 个 皇后 按 行 放 到 棋盘 上 ,然后 递归 放 
置 其 他 的 皇后 ,直到 放 完 。 

(3) 回溯 判断 check()。 判 断 新 放置 的 皇后 和 已 经 放 好 的 皇后 在 横向 、 纵 向 、 斜 对 角 方 
向 是 否 冲突 。 其 中 ,横向 并 不 需要 判断 ,因为 在 递归 的 时 候 已 经 是 按 不 同 的 行 放置 的 。 

(4) 模块 化 编程 。 例 如 check() 的 内 容 很 少 ,其实 可 以 直接 写 在 DFS() 内 部 ,不 用 单独 写 
成 一 个 函数 。 但 是 单独 写成 函数 ,把 功能 模块 化 ,好 处 很 多 ,例如 逻辑 清晰 、 容 易 查 错 等 。 建 议 
在 写 程序 的 时 候 尽 量 把 能 分 开 的 功能 单独 写成 函数 ,这 样 可 以 大 大 减少 编码 和 调试 的 时 间 。 

(5) 复杂 度 。 在 上 述 程序 中 ,DFS() 一 行 行 地 放 皇 后 ,复杂 度 为 O(N1); check() 检 查 
冲突 ,复杂 度 为 OON); 总 复杂 度 为 O(NXN1)。 当 N=10 时 ,已 经 到 千 万 数量 级 。 读 者 可 
以 自己 在 程序 中 统计 运行 次 数 。 经 本 书 作者 验证 ,N= 二 11 时 计算 了 900 万 次 ,N= 二 12 时 计 
算 了 5 千 万 次 。 因 此 ,对 于 N>11 的 N 皇后 问题 ,需要 用 新 的 方法 0。 


@ 用 数据 结构 舞蹈 链 (Dancing Links) 或 者 位 运算 可 以 较 快 地 解决 N 一 15 的 N 皇后 问题 。 对 于 更 大 的 N, 例 如 当 
NN 二 27 时 ,有 2.34X107 个 解 。N 皇后 问题 是 一 个 NP 完全 问题 ,不 存在 多 项 式 时 间 的 算法 。 
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【习题 】 


poj 2531 “Network Saboteur”; 
poj 1416“Shredding Company”; 
poj 2676“Sudoku”; 

poj 1129“Channel Allocation”; 
hdu 1175“ 连 连 看 ”; 

hdu 5113 “Black And White”。 


4.4.3 ”和 迭 代 加 深 搜索 


有 这 样 一 些 题目 ,它们 的 搜索 树 很 特别 : 不 仅 很 深 , 而 且 很 宽 ; 深度 可 能 到 无 穷 ,宽度 
也 可 能 极 广 。 如 果 直 接 用 DFS, 会 陷入 递归 无 法 返回 ; 如 果 直 接 用 BFS, 队 列 空间 会 爆炸 。 

此 时 可 以 采用 一 种 结合 了 DFS 和 BFS 思想 的 搜索 方法 , 即 迭 代 加 深 搜索 (Iterative 
Deepening DFS,IDDFS)。 具 体 的 操作 方法 如 下 : 

(1) 先 设 定 搜索 深度 为 1, 用 DFS 搜索 到 第 1 层 即 停止 。 也 就 是 说 ,用 DFS 搜索 一 个 
深度 为 1 的 搜索 树 。 

(2) 如 果 没 有 找到 答案 ,再 设 定 深度 为 2, 用 DFS 搜索 前 两 层 即 停止 。 也 就 是 说 ,用 
DFS 搜索 一 个 深度 为 2 的 搜索 树 。 

(3) 继续 设 定 深度 为 3、4…… 逐 步 扩大 DFS 的 搜索 深度 ,直到 找到 答案 。 

这 个 迭代 过 程 ,在 每 一 层 的 广度 上 采用 了 BFS 搜索 的 思想 ,在 具体 编程 实现 上 则 是 
DFS 的 。 

一 个 经 典 的 例子 是 “埃及 分 数 ”。 


埃及 分 数 了 
在 古 埃及 ,人 们 使 用 单位 分 数 的 和 ( 形 如 1/a 的 ,a 是 自然 数 ) 表 示 一 切 有 理 数 。 例 
如 2/3 王 1/2 十 1/6 ,但 不 允许 2/3 二 1/3 十 1/3, 因 为 加 数 中 有 相同 的 。 对 于 一 个 分 数 a/b， 
表示 方法 有 很 多 种 ,但 是 哪 种 最 好 呢 ? 首先 ,加 数 少 的 比 加 数 多 的 好 ,其 次 ,加 数 个 数 相 
同 的 ,最 小 的 分 数 越 大 越 好 。 例 如 : 
19/45 一 1/3 十 1/12 十 1/180 
19/45 一 1/3 十 1/15 十 1/45 
19/45 一 1/3 十 1/18 十 1/30 
19/45 一 1/4 十 1/6 十 1/180 
19/45 一 1/5 十 1/6 十 1/18 
最 好 的 是 最 后 一 种 ,因为 1/18 比 1/180、1/45、1/30 都 大 。 给 出 a.b (0 二 a 二 6 过 
1000) ,编程 计算 最 好 的 表达 方式 。 


® http://codevs. cn/problem/1288/ 。 


i 本 二 
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这 一 题 显 然 是 搜索 ,可 以 按 图 4. 9 建立 搜索 树 。 每 一 层 的 元 素 是 分 子 为 1、 分 母 递增 的 
分 数 ; 从 上 往 下 的 一 个 分 支 ,就 是 一 个 这 个 分 支 上 所 有 的 分 数 相 加 的 组 合 ; 找到 合适 的 组 
合 就 退出 。 解 答 树 的 规模 很 大 ,深度 可 能 无 限 ,每 一 层 的 宽度 也 可 能 无 限 。 


图 4.9 深度 和 宽度 极 大 的 搜索 树 


在 这 种 情况 下 适合 使 用 迭代 加 深 搜索 。 其 过 程 如 下 : 

(1) DFS 到 第 1 层 , 只 包括 一 个 分 数 ,如 果 满 足 要 求 就 退出 。 

(2) DFS 前 两 层 , 是 两 个 分 数 的 和 ,例如 1/2 十 1/3、1/2 十 1/4、1/2 十 1/5、…、1/3 十 1/4、…， 
找到 合适 的 答案 就 退出 。 

(3) DFS 前 3 层 …… 

按 上 述 步 又 能 搜索 到 所 有 可 能 的 组 合 ,并 且 规 避 了 直接 使 用 DFS 或 BFS 的 刺 端 。 


4.4.4 IDAx* 


IDA * 是 对 和 迭代 加 深 搜索 IDDFS 的 优化 ,可 以 把 IDA * 看 成 A* 算 法 思想 在 迭代 加 深 
搜索 中 的 应 用 。 

IDDFS 仍然 是 一 种 “盲目 "的 搜索 方法 ,只 是 把 搜索 范围 约束 到 了 可 行 的 空间 内 。 如 果 
在 进行 IDDFS 的 时 候 能 预测 出 当前 DFS 的 状态 ,不 再 继续 深入 下 去 ,那么 就 可 以 直接 返 
回 , 不 再 继续 ,从 而 提高 了 效率 。 

这 个 预测 就 是 在 IDDFS 中 增加 一 个 估价 函数 。 在 某 个 状态 ,经 过 函数 计算 ,发 现 后 续 
搜索 无 解 ,就 返回 。 简 单 地 说 ,就 是 在 IDDFS 的 过 程 中 利用 估价 函数 进行 前 枝 操 作 。 

下 面 这 个 例题 说 明了 IDDFS 和 估价 函数 之 间 的 关系 。 


poj 3134 “Power Calculus” 
给 定数 工 和 nn, 求 xz", 只 能 用 乘法 和 除法 , 算 过 的 结果 可 以 被 利用 。 问 最 少 算 多 少 次 
就 够 了 。 其 中 nn 三 1000。 


这 一 题 等 价 于 从 数字 1 开始 ,用 加 减法 ,最 少 算 多 少 次 能 得 到 。 
搜索 的 范围 是 每 一 步 搜索 ,用 前 一 步 得 出 的 值 和 之 前 产生 的 所 有 值 进行 加 、 减 运算 得 到 
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新 的 值 ,判断 这 个 值 是 否 等 于 。 

这 一 题 的 麻烦 在 于 ,每 一 步 搜 索 ,新 值 的 数量 增长 极 快 。 如 果 直 接 用 DFS ,深度 可 能 有 
1000, 可 能 会 溢出 ; 如 果 用 BFS, 也 可 能 超出 队列 范围 。 

这 一 题 用 IDDFS 非常 合适 ,再 用 估价 函数 进行 剪 枝 , 可 以 高 效 地 完成 计算 。 

(1) IDDFS: 指定 递归 深度 ,每 一 次 做 DFS 时 不 超过 这 个 深度 。 

(2) 估价 函数 : 如 果 当 前 的 值 用 最 快 的 方式 (连续 乘 2 ,倍增 ) 都 不 能 到 达 ,停止 用 这 个 
值 继续 DFS。 


poj 3134 的 代码 


# include < iostream> 
using namespace std; 
int val[1010]; 
int pos, n; 
bool ida( int now, int depth){ 
if(now> depth) return false; 
if(val[pos] << (depth - now) < n) 


// 保 存 一 个 搜索 路 径 上 每 一 步 的 计算 结果 


//IDDFS: 大 于 当前 设 定 的 DES 深度 ,退出 


// 估 价 函 数 :用 最 快 的 倍增 都 不 能 到 达 n, 退出 
// 当 前 结果 等 于 n, 搜索 结束 


return false; 

if(val[pos] == n) return true; 

Ppos ++; 

| 
val[pos] = val[pos-1] + val[il]; 
if(ida(now + 1, depth)) return true; 
val[pos] = abs(val[pos-1] - val[i]); // 上 一 个 数 与 前 面 所 有 的 数 相 减 
if(ida(now + 1, depth)) return true; 


// 上 一 个 数 与 前 面 所 有 的 数 相 加 


上 
pos ;i; 
return false; 
. 
int main(){ 
int t; 
while(cin>>n && n){ 
int depth; 
for(depth = 0 ; ; depth ++){ 
val[pos = 0] = 1; 
if(ida(0, depth)) break; 
} 
cout << depth << endl; 
: 


return 0; 


// 每 次 只 DFS 到 深度 depth 
// 初 始 值 是 1 
// 每 次 都 从 0 层 开始 DFS 到 第 depth 层 


【习题 】 


hdu 1560“DNA sequence”, 经 典 IDA * 题目 ; 
hdu 1667“The Rotation Game”, 经 典 IDA * 题目 。 
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4.5 小 结 


DFS 和 BFS 是 算法 设计 中 的 基本 技术 ,是 基础 的 基础 。 

这 两 种 算法 都 能 遍历 搜索 树 的 所 有 结 点 ,区 别 在 于 如 何 扩展 下 一 个 结 点 。DFS 扩展 子 
结 点 的 子 结 点 ,搜索 路 径 越 来 越 深 ,适合 采用 栈 这 种 数据 结构 ,并 用 递归 算法 来 实现 ; BFS 
扩展 子 结 点 的 兄弟 结 点 ,搜索 路 径 越 来 越 宽 , 适 合用 队列 来 实现 。 

1. 复杂 度 

DFS 和 BFS 对 所 有 的 点 和 边 做 了 一 次 遍历 , 即 对 每 个 结 点 均 做 一 次 且 仅 做 一 次 访问 。 
设 点 的 数量 是 V, 连 接点 的 边 总 数 是 下 ,那么 总 复杂 度 是 O(V 十 E) ,看 起 来 复杂 度 并 不 高 。 
但 是 ,有 些 问 题 的 V 和 已 本 身 就 是 指数 级 的 ,例如 八 数码 问题 的 状态 ,是 O(n!1) 的 。 因 此 ， 
在 搜索 时 需要 用 到 前 枝 、 回 溯 、 双 向 广 搜 、 迭 代 加 深 、A * 、IDA * 等 方法 ,尽量 减少 搜索 的 范 
围 , 使 访问 的 总 次 数 远 远 小 于 O(V 十 E)。 

2. 应 用 场合 

DFS 一 般 用 递归 实现 ,代码 比 BFS 更 短 。 如 果 题 目 能 用 DFS 解决 ,可 以 优先 使 用 它 。 

当然 ,一些 问题 更 适合 用 DFS, 另 一 些 问题 更 适合 用 BFS。 在 一 般 情况 下 ,BFS 是 求解 
最 优 解 的 较 好 方法 ,例如 像 迷 宫 这 样 的 求 最 短路 径 问题 应 该 用 BFS, 具 体内 容 见 第 10 章 中 
的 “最 短路 径 ”; 而 DFS 多 用 于 求 可 行 解 。 在 第 10 章 中 还 有 大 量 应 用 BFS 和 DFS 的 例子 。 
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要 并 查 集 
局 二 又 树 
名 Treap 树 
名 Splay 树 
名 线段 树 
各 树 状 数 组 


竞赛 题 是 对 输入 的 数据 进行 运算 ,然后 输出 结果 。 因 此 ,编写 程序 的 一 个 基本 问题 就 是 
数据 处 理 , 包 括 如 何 存 储 输入 的 数据 、 如 何 组 织 程序 中 的 中 间 数 据 等 。 这 个 技术 就 是 数据 结 
构 。 学 习 数 据 结构 ,建立 计算 思维 的 基础 ,是 成 为 合格 程序 员 的 基本 功 。 本 章 讲解 一 些 常 用 
的 高 级 数据 结构 。 


数据 结构 的 作用 是 分 析 数 据 、 组 织 数据 、 存 储 数据 。 基 本 的 数据 类 型 有 字符 和 数字 ,这 
些 数据 需要 存储 在 空间 中 ,然后 程序 按 规则 读 取 和 处 理 它们 。 

数据 结构 和 算法 不 同 , 它 并 不 直接 解决 问题 ,但 是 数据 结构 是 算法 不 可 分 割 的 一 部 分 。 
首先 ,数据 结构 把 杂乱 无 章 的 数据 有 序 地 组 织 起 来 ,逻辑 清晰 ,易于 编程 处 理 ; 其 次 ,数据 结 
构 便 于 算法 高 效 地 访问 和 处 理 数据 ,大 大 减少 空间 和 时 间 复 杂 度 。 

(1) 存储 的 空间 效率 。 例 如 一 个 围棋 程序 ,需要 存储 棋盘 和 棋盘 上 棋子 的 位 置 。 棋 盘 
可 以 简单 地 用 一 个 19X19 的 二 维 数组 (和 矩阵) 表示 。 每 个 棋子 是 一 个 坐标 ,例如 W[5][6] 
表示 位 于 第 5 行 第 6 列 的 白 棋 。 这 种 二 维 数 组 是 数据 结构 "图 ”的 一 种 描述 ,图 是 描述 点 和 
点 之 间 连 接 关系 的 数据 结构 。 棋 盘 只 是 一 种 简单 的 图 ,更 复杂 的 图 例如 地 图 。 地 图 上 有 两 
种 元 素 , 即 点 \ 点 之 间 直 连 的 道路 。 地 图 比 棋盘 复杂 ,棋盘 的 每 个 点 只 有 上 、 下 左右 4 个 相 
邻 的 点 ,而 地 图 上 的 一 个 点 可 能 有 很 多 相 邻 的 点 。 那 么 如 何 存储 一 个 地 图 ? 可 以 简单 地 用 
一 个 二 维 数 组 ,例如 及 个 点 ,用 一 个 nXn 的 二 维 矩 阵 表示 地 图 ,和 矩阵 上 的 交叉 点 (i,j) 表 
示 第 i 点 和 第 j 点 的 连接 关系 ,例如 1 表示 相 邻 ,0 表示 不 相 邻 。 二 维和 矩阵 这 种 数据 结构 虽 
然 简单 .访问 速度 快 ,但 是 用 它 来 存储 地 图 非常 浪费 空间 ,因为 这 是 一 个 稀疏 和 矩阵 ,其 中 的 交 
叉 点 绝 大 多 数 等 于 0, 这些 等 于 0 的 交叉 点 并 不 需要 存储 。 一 个 有 10 万 个 点 的 地 图 ,存储 
它 的 二 维和 矩阵 大 小 是 100 000X100 000==10GB。 所 以 ,在 程序 中 使 用 二 维 矩 阵 来 存储 地 图 
是 不 行 的 ,例如 手机 上 的 导航 软件 ,常常 有 几 十 万 个 地 点 ,手机 存储 卡 根本 放 不 下 。 因 此 ,大 
地 图 的 存储 需要 用 到 更 有 效率 的 数据 结构 ,这 就 是 邻接 表 。 

(2) 访问 的 效率 。 例 如 输入 一 大 串 个 数 为 n 的 无 序数 字 , 如 果 直 接 存储 到 一 个 一 维 数 
组 里 面 ,那么 要 查找 到 某 个 数据 ,只 能 一 个 个 试 ,需要 的 时 间 是 O(n)。 如 果 先 按 大 小 排序 然 
后 再 查询 ,处 理 起 来 就 很 有 效率 。 在 个 有 序 的 数 中 找 某 个 数 ,用 折 半 查找 的 方法 ,可 以 在 
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O(logzn) 的 时 间 里 找到 。 

用 数据 结构 存储 和 处 理 数据 ,可 以 使 程序 的 逻辑 更 加 清晰 。 

数据 结构 有 以 下 3 个 要 素 ?。 

(1) 数据 的 逻辑 结构 : 线性 结构 (数组 、 栈 队列、 链表) 、 非 线性 结构 .集合 、 图 等 。 

(2) 数据 的 存储 结构 : 顺序 存储 (数组 )、 链 式 存储 .索引 存储 、 散 列 存储 等 。 

(3) 数据 的 运算 : 初始 化 、 判 空 . 统 计 ` 查 找 、. 人 遍历 .插入 删除 .更 新 等 。 

常见 的 数据 结构 有 数组 、 链 表 、 栈 队列、. 树 二叉树、 集合 、 哈 希 . 堆 与 优先 队列 .并 查 集 、 
图 .线段 树 、 树 状 数 组 等 。 

在 第 3 章 中 已 经 介绍 了 基本 的 数据 结构 2 一 一 栈 . 队列、 链表 ,本 章 继续 讲解 一 些 常用 
的 高 级 数据 结构 ,包括 并 查 集 二 又 树 ,线段 树 、 树 状 数组 。 


5.1 并 查 集 


并 查 集 (Disjoint Set) 是 一 种 非常 精巧 而 且 实用 的 数据 结构 , 它 主 要 用 于 处 理 一 些 不 相 
交集 合 的 合并 问题 。 经 典 的 例子 有 连通 子 图 .最 小 生成 树 Kruskal 算法 9 和 最 近 公共 祖先 
(Lowest Common Ancestors,LCA) 等 。 

通常 用 “帮派 ”的 例子 来 说 明 并 查 集 的 应 用 背景 。 在 一 个 城市 中 有 个人, 他们 分 成 不 同 
的 帮派 ; 给 出 一 些 人 的 关系 ,例如 1 号 ,2 号 是 朋友 ,1 号 ,3 号 也 是 朋友 ,那么 他 们 都 属于 一 个 帮 
派 ; 在 分 析 完 所 有 的 朋友 关系 之 后 , 问 有 和 多少 帮 派 , 每 人 属于 哪个 帮派 。 给 出 的 可 能 是 10" 的 。 

读者 可 以 先 思 考 暴 力 的 方法 以 及 复杂 度 。 如 果 用 并 查 集 实现 ,不 仅 代码 很 简单 ,而 且 复 
杂 度 可 以 达到 O(logsn)。 

并 查 集 : 将 编号 分 别 为 1 一 n 的 nn 个 对 象 划 分 为 不 相交 集合 ,在 每 个 集合 中 ,选择 其 中 
某 个 元 素 代表 所 在 集合 。 在 这 个 集合 中 ,并 查 集 的 操作 有 初始 化 、 合 并 查找。 

下 面 先 给 出 并 查 集 操作 的 简单 实现 。 在 这 个 基础 上 .后 文 再 进行 优化 。 

1. 并 查 集 操作 的 简单 实现 

(1) 初始 化 。 定 义 数组 int s[ 是 以 结 点 i 为 元 素 的 并 查 集 ,在 开始 的 时 候 ss 
还 没有 处 理 点 与 点 之 间 的 朋友 关系 ,所 以 每 个 点 属于 独立 的 集 ,并 且 以 元 素 i 加 
的 值 表示 它 的 集 *[ 详 ,例如 元 素 1 的 集 s[1]=1。 

图 5. 1 所 示 为 图 解 ,左边 给 出 了 元 素 与 集合 的 值 ,右边 画 出 了 逻辑 关系 。 为 了 便于 讲解 ， 
左边 区 分 了 结 点 i 和 和 集 (把 集 的 编号 加 上 了 下 画 线 ); 右边 用 圆圈 表示 集 ,方块 表示 元 素 。 


s[ 门 


1 


5.1 并 查 集 的 初始 化 


@ 《数据 结构 与 算法 分 析 新 视角 》, 作 者 周 幸 妮 等 ,电子 工业 出 版 社 。 
四 《数据 结构 (STL 框架 )》, 作 者 王晓东 ,清华 大 学 出 版 社 。 
回 ”参考 本 书 的 “10. 10. 2 kruskal 算法 ”。 
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(2) 合并 ,例如 加 入 第 1 个 朋友 关系 (1,2) ,如 图 5.2 所 示 。 在 并 查 集 * 中 ,把 结 点 1 合 
并 到 结 点 2, 也 就 是 把 结 点 1 的 集 1 改 成 结 点 2 的 集 2。 


a 


图 5.2 合并 (1,2) 


$s[] 
ww 
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ww 


(3) 合并 ,加 入 第 2 个 朋友 关系 (1,3), 如 图 5. 3 所 示 。 查 找 结 点 1 的 集 是 2, 青 递归 查 
找 元 素 2 的 集 是 2, 然 后 把 元 素 2 的 集 2 合并 到 结 点 3 的 集 3。 此 时 , 结 点 1.2、3 属于 一 个 


ni, 
集 。 在 右 图 中 ,为 了 简化 图 示 , 把 元 素 2 和 集 2 画 在 了 一 起 。 
外) 名 


(4) 合并 ,加 入 第 3 个 朋友 关系 (2,4) ,如 图 5.4 所 示 。 结 果 如 下 ,请 读者 自己 分 析 。 


s[] 
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图 5.3 合并 (1,3) 
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图 5.4 合并 (2,4) 


(5) 查找 。 在 上 面 步 又 中 已 经 有 查找 操作 。 查 找 元 素 的 集 是 一 个 递归 的 过 程 ,直到 元 
素 的 值 和 它 的 集 相 等 就 找到 了 根 结 点 的 集 。 从 上 面 的 图 中 可 以 看 到 ,这 棵 搜索 树 的 高 度 可 
能 很 大 ,复杂 度 是 O(n) 的 , 变 成 了 一 个 链表 ,出现 了 树 的 “退化 ”现象 。 

(6) 统计 有 多 少 个 集 。 如 果 ;[ 门 =i, 这 是 一 个 根 结 点 ,是 它 所 在 的 集 的 代表 ; 统计 根 结 
点 的 数量 ,就 是 集 的 数量 。 

下 面 以 hdu 1213 为 例 实现 上 述 操作 。 


hdu 1213 “How Many Tables” 
有 n 个 人 一 起 吃饭 ,有 些 人 互相 认识 。 认 识 的 人 想 坐 在 一 起 ,不 想 跟 陌生 人 坐 。 例 
如 A 认识 B,B 认 识 C, 那 么 A、B.C 会 坐 在 一 张 桌子 上 。 
给 出 认识 的 人 , 问 需要 多 少 张 桌子 。 


一 张 桌子 是 一 个 集 ,合并 朋友 关系 ,然后 统计 集 的 数量 即 可 。 下 面 的 代码 是 并 查 集 操作 
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的 具体 实现 。 


# include <bits/stdc++.h> 
using namespace std; 

const int maxn = 1050; 

int s[maxn]; 


void init set(){ // 初 始 化 
for(int i = 1; i<=maxn; i++) 
s[i] = i; 
J 
int find set(int x){ // 查 找 


return x== s[x]? x:find set(s[x]); 
有 
void union set(int x, int y){ // 合 并 
x = find set(x); 
Y = find set(y); 
if(x!= y) s[x] = sly]; 


| 
int main(){ 
int t, nD, mM, X, Y7 
cin>> t; 
while(t—— ){ 
cin>n>m; 
init set(); 
for(int i = 1; i<=m; i++){ 
cin> x>y; 
union_set(x, y); 
} 
int ans = 0; 
for(int i = 1; i<=n; i++) // 统 计 有 多 少 个 集 
if(s[i] == i) 
anst+; 
cout << ans << endl; 
} 
return 0; 


| 


复杂 度 : 在 上 述 程 序 中 ,查找 find_set()、 合 并 union_set() 的 搜索 深度 是 树 的 长 度 , 复 
杂 度 都 是 O(n) ,性 能 比较 差 。 下 面 介绍 合并 和 查询 的 优化 方法 ,优化 之 后 ,查找 和 合并 的 复 
杂 度 都 小 于 O(logzsn) 。 

2. 合并 的 优化 

在 合并 元 素 x 和 y 时 先 搜 到 它们 的 根 结 点 ,然后 再 合并 这 两 个 根 结 点 , 即 把 一 个 根 结 
点 的 集 改 成 另 一 个 根 结 点 。 这 两 个 根 结 点 的 高 度 不 同 , 如 果 把 高 度 较 小 的 集合 并 到 较 大 的 
集 上 ,能 减少 树 的 高 度 。 下 面 是 优化 后 的 代码 ,在 初始 化 时 用 height[ 门 定义 元 素 i 的 高 度 ， 
在 合并 时 更 改 。 


int height[maxn]; 
void init set(){ 
for(int i = 1; i<=maxn; i++){ 
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i 
height[i] = 0; // 树 的 高 度 
} 
} 
void union_set(int x, int y){ // 优 化 合并 操作 


x = find set(x); 
Y = find set(y); 


证 (height[x] == height[Y]) { 
height[x] = height[x] + 1; // 合 并 , 树 的 高 度 加 一 
s[y] = x; 
} 
elsef // 把 矮 树 并 到 高 树 上 ,高 树 的 高 度 保持 不 变 
证 (height[x] < height[y]) s[x] = y; 
else Ss[y] = x; 


} 

3. 查询 的 优化 一 一 路 径 压缩 

在 上 面 的 查询 程序 find_setO 〇 ) 中 ,查询 元 素 i 所 属 的 集 需 要 搜索 路 径 找到 根 结 点 ,返回 
的 结果 是 根 结 点 。 这 条 搜索 路 径 可 能 很 长 。 如 果 在 返回 的 时 候 顺 便 把 i 所属 的 集 改 成 根 结 
点 ,如 图 5.5 所 示 , 那 么 下 次 再 搜 的 时 候 就 能 在 O(1) 的 时 间 内 得 到 结果 。 


2 1| [2| [31 [4 
图 5.5 路 径 压缩 
程序 如 下 : 
int find set(int x){ 
if(x != s[x]) s[x] = find set(s[x]); // 路 径 压 缩 


return s[x]; 
} 
这 个 方法 称 为 路 径 压 缩 ,因为 在 递归 过 程 中 ,整个 搜索 路 径 上 的 元 素 ( 从 元 素 i 到 根 结 
点 的 所 有 元 素 ) 所 属 的 集 都 被 改 为 根 结 点 。 路 径 压 缩 不 仅 优 化 了 下 次 查询 ,而 且 优化 了 合 


并 ,因为 在 合并 时 也 用 到 了 查询 。 
上 面 的 代码 用 递归 实现 ,如 果 数据 规模 太 大 ,担心 爆 栈 ,可 以 用 下 面 的 非 递 归 代 码 : 


int find set(int x){ 
intr = x 
while (s[r] != r) r=s[r]; // 找 到 根 结 点 
int 1 = x 从 
while(i != r){ 
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j= Bi // 用 临时 变量 j 记录 
s[i] = r; // 把 路 径 上 元 素 的 集 改 为 根 结 点 
和 于 

} 

return r; 


【习题 】 


poj 2524“Ubiquitous Religions”, 并 查 集 简 单 题 。 
poj 1611“The Suspects”, 简 单 题 。 

poj 1703 “Find them，Catch them”。 

poj 2236 “Wireless Network”。 

poj 2492“A Bug's Life”。 

poj 1988 “Cube Stacking”。 

poj 1182“ 食 物 链 ”, 经 典 题 。 

hdu 3635“Dragon Balls”。 

hdu 1856 “More is better”。 

hdu 1272“ 小 希 的 迷宫 ”。 

hdu 1325 “Is It A Tree”。 

hdu 1198 “Farm Irrigation ”。 

hdu 2586 “How far away”, 最 近 公 共 祖 先 ,并 查 集 十 深 搜 。 
hdu 6109“ 数 据 分 割 ”, 并 查 集 十 启发 式 合并 。 


5.2 二 又 树 


树 是 非 线性 数据 结构 , 它 能 很 好 地 描述 数据 的 层次 关系 。 树 形 结构 的 现实 场景 很 常见 ， 
例如 ,文件 目录 ,书本 的 目录 就 是 典型 的 树 形 结构 。 


二 又 树 是 最 常用 的 树 形 结构 ,特别 适合 程序 设计 ,常常 将 一 般 的 树 转 换 成 二 叉 树 来 处 
理 。 本 节 讲 解 二 又 树 的 定义 .人 遍历 问题 ,以 及 二 叉 搜索 树 。 


5.2.1 二 叉 树 的 存储 


1. 二 叉 树 的 性 质 

二 叉 树 的 每 个 结 点 最 多 有 两 个 子 结 点 ,分 别 是 左 孩 子 、 右 孩子 ,以 它们 为 根 的 子 树 称 为 
左 子 树 . 右 子 树 。 

二 叉 树 的 第 i 层 最 多 有 2 一 个 结 点 。 如 果 每 一 层 的 结 点 数 都 是 满 的 , 称 它 为 满 二 又 树 。 
一 个 nn 层 的 满 二 又 树 , 结 点 数量 一 共有 2" 一 1 个 ,可 以 依次 编号 为 1,2,3,…,2" 一 1。 如 果 满 


二 叉 树 只 在 最 后 一 层 有 缺失 ,并 且 缺 失 的 编号 都 在 最 后 ,那么 称 为 完全 二 叉 树 。 满 二 又 树 和 
完全 二 又 树 图 示 如 图 5.6 所 示 。 
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图 5.6 满 二 叉 树 和 完全 二 又 树 


完全 二 又 树 非常 容易 操作 。 一 棵 结 点 数量 为 & 的 完全 二 叉 树 , 设 1 号 点 为 根 结 点 ,有 以 
下 性 质 : 

(1) 这 1 的 结 点 ,其 父 结 点 是 i/2; 

(2) 如 果 2i>k, 那 么 i 没有 孩子 ; 如 果 2i 十 1 二 A, 那 么 z 没 有 右 孩 子 ; 

(3) 如 果 结 点 i 有 孩子 ,那么 它 的 左 孩 子 是 2i, 右 孩子 是 2i 十 1。 

2. 二 叉 树 的 存储 结构 

二 叉 树 一 般 使 用 指针 来 实现 ,并 指向 左右 子 结 点 。 


struct node{ 
int value; // 结 点 的 值 
node *1, x*r; // 指 向 左 、 右 子 结 点 


}; 


在 新 建 一 个 node 时 ,用 new 运算 符 动态 申请 内 存 。 使 用 完毕 后 ,应 该 用 delete 释放 
它 , 和 否则 会 内 存 泄漏 。 

二 叉 树 也 可 以 用 数组 来 实现 。 特 别 是 完全 二 叉 树 ,用 数组 来 表示 父 结 点 和 子 结 点 的 关 
系 非常 简便 。 


5.2.2 二 又 树 的 遍历 


1. 宽度 优先 遍历 


EBGADFICH 的 顺序 访问 ,那么 用 宽度 优先 搜索 是 最 合适 的 。 用 队列 实现 搜 
索 的 过 程 见 本 书 4. 3 节 。 

2. 深度 优先 遍历 

用 深度 优先 搜索 遍历 二 又 树 ,代码 极其 简单 。 

按 深度 搜索 的 顺序 访问 二 叉 树 ,对 根 ( 父 ) 结 点 、 左 
儿子 、 右 儿子 进行 组 合 , 有 先 ( 根 ) 序 遍历 、 中 ( 根 ) 序 遍 
历 、 后 ( 根 ) 序 遍历 这 3 种 访问 顺序 ,这 里 默认 左 儿 子 在 
右 儿子 的 前 面 。 

(1) 先 序 遍 历 。 即 按 父 结 点 、 左 儿子 、 右 儿子 的 顺序 
访问 。 在 图 5. 7 中 ,访问 返回 的 顺序 是 EBADCGFIH 。 图 5.7 二 叉 树 的 遍历 
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先 序 遍历 的 第 1 个 结 点 是 根 。 先 序 遍 历 的 伪 代 码 如 下 : 


void preorder(node * root){ 


cout << root —> value; // 输 出 
preorder(root —>1); // 递 归 左 子 树 
preorder(root —>r); // 递 归 右 子 树 
} 
(2) 中 序 遍 历 。 按 左 儿子 、 父 结 点 、 右 儿子 的 顺序 访问 。 在 图 5.7 中 ,访问 返回 的 顺序 


是 ABCDEFGHI。 读 者 可 能 注意 到 “ABCDEFGH7I”* 刚 好 是 字典 序 , 这 不 是 巧合 ,是 因为 图 
示 的 是 一 个 二 叉 搜 索 树 。 在 二 又 搜索 树 中 ,中 序 遍历 实现 了 排序 功能 ,返回 的 结果 是 一 个 有 
序 排 列 。 中 序 遍 历 还 有 一 个 特征 : 如 果 已 知 根 结 点 ,那么 在 中 序 遍 历 的 结果 中 , 排 在 根 结 点 
左边 的 点 都 在 左 子 树 上 , 排 在 根 结 点 右边 的 点 都 在 右 子 树 上 。 例 如 ,E 是 根 ,E 左边 的 
“ABCD” 在 它 的 左 子 树 上 ; 再 如 ,在 子 树 “ABCD” 上 ,B 是 子 树 的 根 ,那么 “A” 在 它 的 左 子 树 
上 ,“CD” 在 它 的 右 子 树 上 。 

(3) 后 序 遍 历 。 按 左 儿 子 、 右 儿子 、 父 结 点 的 顺序 访问 。 在 图 5.7 中 ,访问 返回 的 顺序 


站 是 ACDBFHIJGE。 后 序 遍 历 的 最 后 一 个 结 点 是 根 。 

如 果 已 知 某 棵 二 叉 树 的 3 种 遍历 ,可 以 把 这 棵 树 构造 出 来 , 即 

@ “中 序 遍 历 十 先 序 遍 历 * 或 者 "中 序 遍 历 十 后 序 遍 历 ", 都 能 确定 一 
棵 树 。 

局 但 是 ,如 果 不 知道 中 序 遍 历 ,只 有 * 先 序 饥 历 十 后 序 遍 历 ", 不 


图 5.8 “ 先 序 遍历 十 后 ”能 确定 一 棵 树 。 例 如 图 5. 8 中 两 棵 不 同 的 二 又 树 ,它们 的 先 序 遍 
序 人 遍历 ”不 能 确 ” 历 都 是 “1 2 3”, 后 序 遍 历 都 是 “3 2 1”。 
定 一 棵 树 上 述 几 种 DFS 遍历 的 实现 见 下 面 例题 给 出 的 代码 。 


hdu 1710“Binary Tree Traversals” 
输入 二 又 树 的 先 序 和 中 序 遍 历 序列 , 求 后 序 遍 历 。 
(1) 输入 样 例 。 
先 上 证 
中 序 :472185936 
(2) 输出 样 例 。 
后 序 :742895631 


建树 的 过 程 如 下 : 

(1) 先 序 遍历 的 第 1 个 数 是 整 棵 树 的 根 , 例 如 样 例 中 的 “1”。 知 道 了 “1? 是 根 , 对 照 中 序 
遍历 ,“1” 左 边 的 “4 7 2 都 在 根 的 左 子 树 上 ,右边 的 “8 5 9 3 6” 都 在 根 的 右 子 树 上 。 

(2) 递归 上 述 过 程 。 例 如 ,上 面 步骤 得 到 的 中 序 遍 历 的 “4 7 2”, 对 照 先 序 的 第 2 个 数 是 
“2”, 那 么 “2” 是 左 子 树 的 根 ,在 中 序 遍 历 的 “4 7 2? 中 ,2? 左 边 的 “4 7” 都 在 以 “2” 为 根 的 左 子 

图 5. 9 所 示 为 示意 图 , 画 线 的 数字 是 读 取 先 序 遍历 逐一 处 理 的 当前 步骤 的 根 , 方 框 内 是 
中 序 遍 历 的 部 分 数字 。 
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472 ||185936 85936 O) 85936 


图 5.9 用 先 序 遍历 和 中 序 遍历 建 二 叉 树 


下 面 是 hdu 1710 的 代码 ,其 中 preorder()、inorder()、postorder() 分 别 是 先 序 遍 历 、 中 
序 遍历 和 后 序 遍 历 。 可 以 看 到 ,用 DFS 实现 的 二 叉 树 遍历 代码 非常 简单 。 


#include < bits/stdc++.h> 
using namespace std; 
const int N = 1010; 
int pre[N], in[N], post[N]; // 先 序 、 中 序 、 后 序 
int k; 
struct node{ 
int value; 
node *1, *r; 
node(int value = 0, node *1 = NULL, node *r = NULL):value(value), 1(1), r(r){} 
}; 
void buildtree( int 1, int r, int &t, node* &root) { // 建 树 
int flag = -1; 
for(int i = 1; i<=r; i++) // 先 序 的 第 1 个 数 是 根 ,找到 对 应 的 中 序 的 位 置 
if(in[i] == pre[t]){ 
flag = i; break; 
} 


if(flag == 一 1) return; // 结 束 
root = new node(in[flag]); // 新 建 结 点 
t++; 


if(flag>1) buildtree(], flag - 1, t, root ->1); 
if(flag<r) buildtree(flag + 1, r, t, root ->r); 
. 


void preorder(node * root){ // 求 先 序 序列 
if(root != NULL){ 
post[k++] = root —> value; // 输 出 


preorder(root —>1); 
preorder(root —>r); 


} 
} 
void inorder(node * root){ // 求 中 序 序列 
if(root != NULL){ 
inorder (root ->1); 
post[k++] = root ->value; // 输 出 
inorder(root —>r); 
void postorder(node * root){ // 求 后 序 序列 


» 


算法 竞赛 入 门 到 进 阶 


if(root != NULL){ 


} 


. 


postorder(root —>1); 
postorder(root —>r); 
post[k++] = root ->value; // 输 出 


void remove tree(node * root){ // 释 放空 间 
if(root == NULL) return; 
remove tree(root 一 >1); 


remove tree(root ->r); 


delete root; 


.| 


int main(){ 


int n; 
while(~scanf("%d", gn)){ 


} 


for(int i=1;i<=n;it+) scanf(" %d", gpre[i]); 

for(int j=1;j<=n;j++) scanf(" %d", &in[j]); 

node * root; 

intt = 1; 

buildtree(1, n, t, root); 

k= 0; // 记 录 结 点 个 数 

postorder (root); 

for(int i=0;i<k;it+) printf(" %d%c",post[i],i==k-1?'\n':' '); 
// 作 为 验证 ,这 里 可 以 用 preorder() 和 inorder() 检 查 先 序 和 中 序 遍 历 


remove_tree( root); 


return 0; 


j 


代码 中 的 remove_tree() 释 放 申 请 的 空间 ,如 果 不 释 放 , 会 内 存 泄漏 ,造成 内 存 浪费 。 释 
放空 间 是 标准 的 正确 的 操作 。 不 过 ,竞赛 题目 的 代码 很 少 ,即使 不 释放 空间 ,也 不 会 出 错 ; 


而 且 程序 终止 后 , 它 申请 的 空间 也 会 被 系统 收回 。 
5. 2.5 节 给 出 了 用 数组 实现 二 又 树 的 例子 。 


5%2:3 


BST(Binary Search Tree, 二 又 搜索 树 ) 是 非常 有 用 的 数据 结构 , 它 的 结构 精巧 .访问 高 


二 又 搜索 树 


效 。BST 的 特征 如 下 : 


(1) 每 


Es 


(2) 任意 一 个 结 点 的 键 值 , 比 它 左 子 树 的 所 有 结 点 的 键 值 大 , 比 它 右 子 树 的 所 有 结 点 的 
键 值 小 。 也 就 是 说 ,在 BST 上 ,以 任意 结 点 为 根 结 点 的 一 棵 子 树 仍然 是 BST。BST 是 一 棵 
有 序 的 二 叉 树 。 可 以 推出 , 键 值 最 大 的 结 点 没有 右 儿子 , 键 值 最 小 的 结 点 没有 左 儿子 。 

图 5. 10 是 一 棵 二 又 搜索 树 ,用 中 序 遍 历 可 以 得 到 它 的 有 序 排 列 。 右 图 的 虚线 把 每 个 结 
点 隔 开 , 很 容易 看 出 , 结 点 正好 按 从 小 到 大 的 顺序 被 虚线 隔 开 了 。 有 虚线 的 帮助 ,很 容易 理 


解 后 文 介绍 Treap 树 和 Splay 树 时 提 到 的 “旋转 ”技术 。 


a 


个 元 素 有 唯一 的 键 值 ,这 些 键 值 能 比较 大 小 。 通 常 把 键 值 存放 在 BST 的 结 
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WV 3 © ! 
图 5.10 二 叉 搜 索 树 


数据 的 基本 操作 是 插入 .查询 .删除 。 给 定 一 个 数据 序列 ,如 何 实现 BST? 下 面 给 出 一 
种 朴素 的 实现 方法 。 

(1) 建树 和 插入 。 以 第 1 个 数据 z 为 根 结 点 ,逐个 插入 其 他 所 有 数据 。 插 人 过 程 从 根 
结 点 开始 ,如 果 数 据 y 比 根 结 点 x 小 ,就 往 x 的 左 子 树 上 插 ,否则 就 往 右 子 树 上 插 ; 如 果子 
树 为 空 ,就 直接 放 到 这 个 空位 ,如 果 非 空 ,就 与 子 树 的 值 进行 比较 ,再 进入 子 树 的 下 一 层 , 直 
到 找到 一 个 空位 置 。 新 插入 的 数据 肯定 位 于 一 个 最 底层 的 叶子 结 点 ,而 不 是 插 到 中 间 某 个 
结 点 上 替代 原来 的 数据 。 

从 建树 的 过 程 可 知 ,如 果 按 给 定 序列 的 顺序 进行 插入 ,最 后 建成 的 BST 是 唯一 的 。 形 
成 的 BST 可 能 很 好 ,也 可 能 很 坏 。 在 最 坏 的 情况 下 .例如 一 列 有 序 整 数 {1, 2, 3, 4, 5, 6， 
7) , 按 顺 序 插入 ,会 全 部 插 到 右 子 树 上 ; BST 退化 成 一 个 只 包含 右 子 树 的 链表 ,从 根 结 点 到 
最 底层 的 叶子 ,深度 是 n, 导 致 访问 一 个 结 点 的 复杂 度 是 O(n)。 在 最 好 的 情况 下 ,例如 序列 
{4, 2, 1,，3, 6,5, 7) ,得 到 的 BST 左 、 右 子 树 是 完全 平衡 的 ,深度 是 logsn, 访 问 复杂 度 是 
Odogzn)。 退 化 的 BST 和 平衡 BST 如 图 5. 11 所 示 。 


图 5.11 退化 的 BST 和 平衡 BST 


(2) 查询 。 建 树 过 程 实际 上 也 是 一 个 查询 过 程 ,所 以 查询 仍然 是 从 根 结 点 开始 的 递归 
过 程 。 访 问 的 复杂 度 取决 于 BST 的 形态 。 

(3) 删除 。 在 删除 一 个 结 点 工 后 , 剩 下 的 部 分 应 该 仍然 是 一 个 BST。 首 先 找到 被 删 结 
点 工 , 如 果 工 是 最 底层 的 叶子 结 点 ,直接 删除 ; 如 果 z 只 有 左 子 树 L 或 者 只 有 右 子 树 R, 直 
接 删 除 x, 原 位 置 由 工 或 R 代替。 如 果 zz 左右 子 树 都 有 ,情况 就 复杂 了 ,此 时 ,原来 以 x 为 
根 结 点 的 子 树 需 要 重新 建树 。 一 种 做 法 是 ,搜索 z 左 子 树 中 的 最 大 元 素 y ,移动 到 并 的 位 
置 , 这 相当 于 原来 以 y 为 根 结 点 的 子 树 ,删除 了 y, 然 后 继续 对 y 的 左 子 树 进行 类 似 的 操作 ， 
这 也 是 一 个 递归 的 过 程 。 删 除 操作 的 复杂 度 也 取决 于 BST 的 形态 。 

(4) 遍历 。 在 5.2. 2 节 中 提 到 用 中 序 遍 历 BST ,返回 的 是 一 个 从 小 到 大 的 排序 。 

根据 上 述 过 程 可 知 ,BST 的 优 劣 取决 于 它 是 否 为 一 个 平衡 的 二 叉 树 。 所 以 ,BST 有 

久 莹 贡 堪 
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关 算 法 的 主要 功能 是 努力 使 它 保持 平衡 。 那 么 如 何 实现 一 个 平衡 的 BST? 由 于 无 法 提 
前 安排 元 素 的 顺序 (如 果 能 一 次 读 入 所 有 元 素 , 也 能 调整 顺序 ,但 是 会 大 费 周章 ,没有 必 
要 ), 所 以 只 能 在 建树 之 后 通过 动态 调整 使 它 变 得 平衡 。BST 算法 的 区 别 就 在 于 用 什么 
办 法 调整 。 

BST 算法 有 AVL 树 、 红 黑 树 、Splay 树 、Treap 树 、.SBT 树 等 。 其 中 容易 编程 的 有 Splay 
树 、Treap 树 等 ,也 是 算法 竞赛 中 容易 出 的 题目 ,本 节 后 续 讲 解 Treap 树 和 Splay 树 。 

BST 是 一 个 动态 维护 的 有 序数 据 集 ,用 DFS 对 它 进行 中 序 遍 历 可 以 高 效 地 输出 字典 
序 .查找 第 & 大 的 数 等 。 

STL 与 BST。STL 中 的 set 和 map 是 用 二 又 搜索 树 ( 红 黑 树 ) 实 现 的 ,检索 和 更 新 的 复 
杂 度 是 O(logsn)。 如 果 一 个 题目 需要 快速 访问 集合 中 的 数据 ,可 以 用 set 或 map 实现 ,内 
容 见 本 书 第 3 章 。 


【习题 】 


hdu 3999“The order of a Tree”, 模 拟 BST 的 建树 和 访问 。 
hdu 3791“ 二 又 搜索 树 ”, 模 拟 BST。 
poj 2418 “Hardwood Species”, 用 map 快速 处 理 字 符 串 。 


5.2.4 Treap 树 


首先 研究 一 种 比较 简单 的 平衡 二 又 搜索 树 一 一 Treap 树 。 

Treap 是 一 个 合成 词 ,把 Tree 和 Heap 各 取 一 半 组 合 而 成 。Treap 是 树 和 堆 的 结合 ,可 
以 翻译 成 树 堆 。 

二 叉 搜索 树 的 每 个 结 点 有 一 个 键 值 , 除 此 之 外 ,Treap 树 为 每 个 结 点 人 为 添加 了 一 个 被 
称 为 优先 级 的 权 值 。 对 于 键 值 来 说 ,这 棵 树 是 排序 二 又 树 ; 对 于 优先 级 来 说 ,这 棵 树 是 一 个 
堆 。 堆 的 特征 是 : 在 这 棵 树 的 任意 子 树 上 , 根 结 点 的 优先 级 最 大 。 

1. Treap 树 的 唯一 性 

Treap 树 的 重要 性 质 : 令 每 个 结 点 的 优先 级 互 不 相等 ,那么 整 棵 树 的 形态 是 唯一 的 ,和 
元 素 的 插入 顺序 没有 关系 。 

下 面 用 7 个 结 点 举例 说 明 建 树 过 程 ,其 键 值 分 别 是 {a,5,c,d,e,f,g), 优 先 级 分 别 是 
16,5,2,7,3,4,1)。 图 5.12(a) 的 纵向 是 优先 级 .横向 是 结 点 的 键 值 ; 图 5. 12(b) 按 二 又 搜 
索 树 的 规则 建 了 一 棵 树 ; 图 5. 12(c) 是 结果 。 从 这 个 图 中 可 以 看 出 Treap 树 的 形态 是 唯一 的 。 

2. Treap 树 的 平衡 问题 

从 图 5. 12 可 知 , 树 的 形态 依赖 于 结 点 的 优先 级 。 那 么 如 何 配置 每 个 结 点 的 优先 级 , 才 
能 避免 二 又 树 的 形态 退化 成 链表 ? 最 简单 的 方法 是 把 每 个 结 点 的 优先 级 进行 随机 赋值 , 那 
么 生成 的 Treap 树 的 形态 也 是 随机 的 。 这 虽然 不 能 保证 每 次 生成 的 Treap 树 一 定 是 平衡 
的 ,但 是 期 望 @ 的 插入 删除 .查找 的 时 间 复 杂 度 都 是 O(logsn) 的 。 


@ 关于 期 望 的 概念 , 见 本 书 中 的 “8.4 概率 和 数学 期 望 ”。 
Pe 
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(a) 键 值 和 优先 级 (b) 建树 (c) 形成 的 Treap 树 


图 5.12 Treap 树 的 形态 


了 解 了 Treap 树 的 概念 ,读者 可 以 尝试 自己 完成 建树 的 过 程 。 在 阅读 下 面 的 内 容 之 前 ， 
不 妨 自己 先 试 一 试 。 

3. Treap 树 的 插入 

如 果 预 先知 道 所 有 结 点 的 优先 级 ,那么 建树 很 简单 , 先 按 优先 级 排序 ,然后 按 优先 级 从 
高 到 低 的 顺序 插入 即 可 。 例 如 在 图 5. 12 中 ,最 高 优先 级 的 d 第 1 个 插入 ,是 树 根 ; 第 2 优 
先 级 的 a 比 d 小 , 插 到 4 的 左 子 树 上 ; 第 3 优先 级 的 5 比 a 大 , 插 到 a 的 右 子 树 …… 

不 过 ,其 实 并 不 需要 这 么 做 。 更 简单 的 做 法 是 每 读 入 一 个 新 结 点 ,为 它 分 配 一 个 随机 的 
优先 级 ,插入 到 树 中 ,在 插入 时 动态 调整 树 的 结构 ,使 它 仍然 是 一 棵 Treap 树 。 

把 新 结 点 node 插入 到 Treap 树 的 过 程 有 以 下 两 步 : 

(1) 用 朴素 的 插入 方法 把 node 按键 值 大 小 插入 到 合适 的 子 树 上 。 

(2) 给 node 随机 分 配 一 个 优先 级 ,如 果 node 的 优先 级 违反 了 堆 的 性 质 , 即 它 的 优先 级 
比 父 结 点 高 ,那么 让 node 往 上 走 ,替代 父 结 点 ,最 后 得 到 一 个 新 的 Treap 树 。 

步骤 (2) 中 的 调整 过 程 用 到 了 一 种 技巧 一 一 旋转 ,包括 左旋 和 右 旋 , 如 图 5. 13 所 示 。 
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图 5.13 Treap 树 的 旋转 (把 k 旋转 到 根 ) 


旋转 的 代码 如 下 ,其 中 son[0] 是 左 儿 子 ,son[1] 是 右 儿 子 , 代 码 中 定义 的 结 点 名 称 和 
图 5. 13 中 的 结 点 名 称 对 应 。 


void rotate(Node * &o, int d){ //d= 0, 左 旋转 ; d= 1, 右 旋 
Node *k=o->son[d^1]; //d^1 与 1-d 等 价 ,但 是 更 快 
o->son[d^1]=k->son[d]); // 图 中 的 x 
k->son[d]=0o; 
o=k; // 返 回 新 的 根 


好 省 四 庆 


算法 竞赛 入 门 到 进 阶 


这 里 仍然 以 键 值 为 {a,5,c,d,e,f,g)、 优 先 级 为 {6,5,2,7,3,4,1} 的 Treap 树 为 例 , 调 
整 过 程 如 下 : 图 5. 14(a) 是 初始 Treap 树 ; 图 5.14(b) 插 入 4 点 , 按 朴 素 的 插入 方法 插入 到 
底部 ; 图 5.14(c) 中 4 的 优先 级 比 父 结 点 c< 高 ,左旋 ,上 升 ; 图 5.14(d) 中 4 的 优先 级 比 新 的 
父 结 点 5 高 ,继续 左旋 ,上 升 ; 图 5. 14(e) 中 ,d 再 次 左旋 ,上 升 ,完成 了 新 的 Treap 树 。 


(a) 初始 状态 (b) 插入 d (0) d 左 旋 (d) 左旋 (e) d 左 旋 
5.14 Treap 树 的 插入 和 调整 


4. Treap 树 的 删除 

如 果 待 删除 的 结 点 x 是 叶子 结 点 ,直接 删除 。 

如 果 待 删除 的 结 点 x 有 两 个 子 结 点 ,那么 找到 优先 级 最 大 的 子 结 点 ,把 z 向 相反 的 方 
向 旋转 ,也 就 是 把 z 向 树 的 下 层 调整 ,直到 z 被 旋转 到 叶子 结 点 ,然后 直接 删除 。 

5. 分 裂 与 合并 问题 

有 时 需要 把 一 棵 树 分 裂 成 两 棵 树 ,或 者 把 两 棵 树 合并 成 一 棵 树 。Treap 树 做 这 样 的 操 
作 是 比较 烦琐 的 。 读 者 可 以 用 上 面 的 例子 尝试 一 下 分 裂 和 合并 ,例如 在 图 5. 12Cc) 中 , 先 把 
树 分 成 {a,5} 和 {c,d,e,f,g} 两 棵 树 , 然 后 青 合并 。 注 意 在 分 橡 和 合并 时 仍然 需要 符合 
Treap 树 的 规则 。 

5.2.5 节 提 到 的 Splay 树 做 分 裂 和 合并 的 操作 非常 简便 。 

6. Treap 与 名 次 树 问 题 

竞赛 中 与 Treap 有 关 的 题目 很 多 涉及 名 次 树 .例如 : 


hdu 4585 “Shaolin” 

少林 寺 的 第 1 个 和 尚 是 方丈 ,作为 功夫 大 师 , 他 规定 每 个 加 入 少林 寺 的 年 轻 和 尚 要 
选 一 个 老 和 尚 来 一 场 功夫 战斗 。 每 个 和 尚 有 一 个 独立 的 id 和 独立 的 战斗 等 级 ,新 和 尚 
可 以 选择 跟 他 的 战斗 等 级 最 接近 的 老 和 尚 战斗 。 

方丈 的 id 是 1, 战 斗 等 级 是 10" 。 他 丢失 了 战斗 记录 ,不 过 他 记得 和 尚 们 加 入 少林 
寺 的 早晚 顺序 。 请 帮 他 恢复 战斗 记录 。 

输入 : 第 1 行 是 一 个 整数 n,0 二 n 二 100 000, 和 尚 的 人 数 , 但 不 包括 方 克 本 人 。 下 面 
用 行 ,每 行 有 两 个 整数 kg, 表 示 一 个 和 尚 的 id 和 战斗 等 级 ,0 三 k,g 三 5 000 000。 和 
尚 以 升序 排序 , 即 按 加 入 少林 寺 的 时 间 排 序 。 最 后 一 行 用 0 表示 结束 。 

输出 : 按时 间 顺 序 给 出 战斗 ,打印 出 每 场 战斗 中 新 和 尚 和 老 和 尚 的 id。 


。 74 -。 
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输出 样 例 : 
21 
32 
42 


题 意 很 简单 , 先 对 老 和 尚 的 等 级 排序 ,在 加 入 一 个 新 和 尚 时 ,找到 等 级 最 接近 的 老 和 尚 ， 
输出 老 和 尚 的 id。 由 于 题目 给 的 比较 大 ,因此 总 复杂 度 需 要 是 O(nlogzn) 的 。 

此 题 有 多 种 解法 ,这 里 给 出 两 种 解法 一 一 STL map、Treap 树 。 

1) STL map 代码 

STL 的 map 和 set 都 是 用 二 叉 搜 索 树 实现 的 。 这 一 题 可 以 用 map 来 做 。 


#include < bits/stdc++.h> 
using namespace std; 
map < int, int > mp; // 让 ->first 是 等 级 ,让 -> second 是 id 
int main(){ 
int n; 
while (一 scanf("%d",&n) && n){ 
mp. clear( ); 


mp[1000000000] = 1; // 方 区 1, 等 级 是 1 000 000 000 
while(n—— ){ 

int id,g; 

scanf("%d%d", &id, &g); // 新 和 尚 id, 等 级 是 g 

mp[g] = id; // 新 和 尚 进 队 

int ans; 


map< int, int >: :iterator it = mp.find(g); // 找 到 排 好 序 的 位 置 
证 (让 == mp.begin()) ans= (++it) 一 > second; 


else{ 
map< int, int > :: iterator it2= it; 
J // 等 级 接近 的 前 后 两 个 老 和 尚 


让 
ans = 让 2 一 > second; 
else ans = 让 一 > second; 
} 
printf("%d %d\n", id,ans); 


return 0; 
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2) Treap 树 代 码 
下 面 的 Treap 程序 ?给 出 了 Treap 树 的 常用 操作 : 定义 结 点 struct Node、 旋 转 rotate() , 插 
入 insert() 、 找 第 & 大 的 数 kth() 、 查 询 某 个 数 find() 。 


注意 其 中 的 kth() 和 find() , 它 与 名 次 树 问 题 有 关 。 
名 次 树 有 两 个 功能 : 四 找到 第 & 大 的 元 素 ; @ 查 询 元 素 
工 的 名 次 , 即 工 排名 第 几 。 这 两 个 功能 的 实现 借助 于 给 
结 点 增加 的 一 个 size 值 。 一 个 结 点 的 size 值 是 以 它 为 根 
的 子 树 的 结 点 总 数量 ,例如 图 5. 15 所 示 的 名 次 树 。 图 中 
结 点 上 标注 的 数字 就 是 这 个 结 点 的 size。 


图 5.15 名 次 树 下 面 的 代码 中 给 出 了 找 第 大 数 的 函数 kthQ 〇 以 及 查 
询 元 素 名 次 的 函数 find() ,它们 的 复杂 度 都 是 O(logzn) 的 。 
hdu 4585 的 Treap 代码 (名 次 树 ) 


#include < bits/stdc++.h> 
using namespace std; 

int id[5000000 + 5]; 

struct Node{ 


}; 


int size; // 以 这 个 结 点 为 根 的 子 树 的 结 点 总 数量 ,用 于 名 次 树 
int rank; // 优 先 级 

int key; // 键 值 

Node * son[2]; //son[0] 是 左 儿子 ，son[1] 是 右 儿 子 


bool operator < (const Node &a)const{return rank < a. rank;} 
int cmp( int x)const{ 
if(x== key) return -1; 
return x< key?0:1; 
Ll 
void update( ){ // 更 新 size 
size=1; 
if(son[0]!= NULL) size+= son[0] -> size; 
if(son[1]!= NULL) size += son[1] -> size; 


} 


void rotate(Node* &o, int d){ //d=0, 左 旋 ; d= 1, 右 旋 


Node *k=o->son[d^1]; //d^1 与 1-d 等 价 , 但 是 更 快 
o->son[d^1]=k->son[d]); 

k-> son[d] =o; 

0-> update(); 

k-> update( ); 

o=k; 


; 


void insert(Node * &o, int x){ // 把 x 插入 到 树 中 


if(o==NULL){ 
o=new Node(); 
o->son[0]=o->son[1] = NULL; 
0—>rank= rand(); 
0->key=x; 


@ ”部 分 代码 改编 自 (算法 竞赛 入 门 经 典 训练 指南 ), 作 者 刘 汝 佳 、 陈 锋 , 清 华 大 学 出 版 社 ,3. 5.2 节 ,231 页 。 
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o0->size=1; 

} 

else{ 
int d=0—>cmp(x); 
insert(o 一 > son[d],x); 
o->update(); 
if(o<o->son[d]) 

rotate(o,d "1); 


int kth(Node * ov int k){ // 返 回 第 k 大 的 数 
if(o== NULL||k<=0||k>o-> size) 
return -1; 
int s=o-> son[1] == NULL?0:0—> son[1] -> size; 
if(k== s+1) return 0—>key; 
else if(k<= s) return kth(o— > son[1],k); 
else return kth(o—> son[0],k-s—-1); 
' 
int find(Node* o,int k){ // 返 回 元 素 k 的 名 次 


if(o==NULL) 

return -1; 
int d= 0—-> cmp(k); 
if(d== -1) 


return o 一 > son[1] == NULL? 1: 0o—> son[1] -> size+1; 
else if(d==1) return find(o 一 > son[d],k); 
else{ 

int tmp= find(o 一 > son[d],k); 

if(tnmp == 一 1) return -1; 

else 


return o 一 > son[1] == NULL? tmp+1 : tmpp+1+0->son[1] -> size; 


int main(){ 

int n; 

while(~scanf("%d",&n)g&gn){ 
srand(time( NULL) ); 
int k,g; 
scanf("%dg%d", gk,&g); 
Node * root = new Node(); 
root—> son[0] = root -> son[1] = NULL; 
root 一 > rank = rand(); root ->key= gj; root -> size=1; 
id[g] =k; 
printf("%d %d\n",k,1); 
for(int i=2;i<=n;i++){ 

scanf("%ds%d",g&k,&9); 


id[g] =k; 

insert(root, g); 

int t= find(root, g); // 返 回 新 和 尚 的 名 次 
int ansl, ans2,ans; 

ansl = kth(root,t — 1); // 前 一 名 的 老 和 尚 
ans2 = kth(root,t +1); // 后 一 名 的 老 和 尚 


if(ansl!= - l&&ans2!= —1) 
ans = ansl 一 g9>=g 一 ans2 ? ans2:ansl; 
else if(ansl== -1) ans = ans2; 


本 让 
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else ans =ansl; 
printf(" %d $d\n",k, id[ans]); 


return 0; 


【习题 】 


poj 1442, 名 次 树 问 题 。 
hdu 3726 “Graph and Queries” ,离线 算法 十 Treap 维护 名 次 树 。 该 题 非 常 经 典 , 是 必 做 
题 。 


5.2.5 Splay 树 


Splay 树 是 一 种 BST 树 , 它 的 查找 、 插 入、 删除、 分割 ,合并 等 操作 ,复杂 度 都 是 O(logsn) 
的 。 它 最 大 的 特点 是 可 以 把 某 个 结 点 往 上 旋转 到 指定 位 置 ,特别 是 可 以 旋转 到 根 的 位 置 ,成 
为 新 的 根 结 点 。 它 有 这 样 一 种 应 用 背景 : 如 果 需 要 经 常 查询 和 使 用 一 个 数 , 那 么 把 它 旋转 
到 根 结 点 ,这样 下 次 访问 它 , 只 需要 查 一 次 就 找到 了 。 

Splay 树 有 Treap 树 不 具备 的 特点 : Splay 树 允 许 把 任意 结 点 旋转 到 根 , 而 Treap 树 
不 能 ,因为 它 的 形态 是 固定 的 ; 四 当 需 要 分 裂 和 合并 时 ,Splay 树 的 操作 非常 简便 。 

下 面 介绍 Splay 操作 ,其 中 提 根 操作 是 核心 。 

1. 把 结 点 旋转 到 根 ( 提 根 ) 

Splay 树 比 Treap 树 的 旋转 操作 的 情况 更 多 。 

那么 如 何 把 一 个 结 点 工 自 底 向 上 旋转 到 根 ? 根据 zx 的 位 置 ,有 以 下 3 种 情况 。 

(1) zz 的 父 结 点 就 是 根 , 只 需要 旋转 一 次 。 图 5. 16 给 出 了 zz 是 根 c 的 左 儿 子 的 情况 , 右 
儿子 的 情况 与 之 类 似 。 注 意 观察 图 中 的 中 序 遍 历 , 即 二 叉 搜索 树 的 顺序 “ae x bc d”, 保 持 不 变 。 


(2 © 
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ORGO © 
图 5.16 Splay 旋转 情况 1 


(2) 工 的 父 结 点 不 是 根 ,z\z 的 父 结 点 .zz 的 父 结 点 的 父 结 点 ,三 点 共 线 。 此 时 可 以 做 两 
次 单 旋 , 即 先 旋转 z 的 父 结 点 ,再 旋转 工 , 如 图 5. 17 所 示 。 

(3) zz 的 父 结 点 .的 父 结 点 的 父 结 点 ,三 点 不 共 线 。 把 z 按 不 同方 向 旋转 两 次 ,如 
图 5.18 所 示 。 

按 上 述 方法 可 以 把 任何 深度 的 结 点 zx 旋转 到 根 。 

旋转 一 次 的 时 间 是 个 常数 ,那么 把 zx 从 所 在 的 深度 提 到 根 ,总 复杂 度 是 多 少 ? 如 果 是 
平衡 二 又 树 ,最 深 的 结 点 深度 是 O(logzn) ,那么 总 复杂 度 就 是 O(logzn)。 当 然 二 叉 树 不 一 
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图 5.17 Splay 旋转 情况 2 
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图 5.18 Splay 旋转 情况 3 


定 是 平衡 的 ,不 过 在 均 挫 意义 上 ,可 以 把 Splay 提 根 操作 的 复杂 度 看 成 是 O(log:z) 的 。 这 就 
是 二 叉 树 这 种 数据 结构 带 来 的 优势 。 

下 面 的 插入 .分裂 .合并 ,复杂 度 和 提 根 的 复杂 度 类 似 。 

2. 插入 

插入 和 普通 二 叉 搜 索 树 的 方法 一 样 。 在 插入 之 后 ,可 以 根据 需要 对 新 插入 的 结 点 做 
Splay 操作 。 

3. 分 裂 

以 第 小 的 数 为 界 , 把 树 分 成 两 部 分 。 先 把 第 小 的 元 素 旋 转 到 树 根 ,然后 把 它 与 右 子 
树 断 开 , 就 得 到 了 两 棵 树 。 

4. 合并 

可 合并 的 两 棵 树 , 其 中 一 棵 树 ( 设 为 left) 的 所 有 元 素 应 该 小 于 另 一 棵 树 ( 设 为 right) 的 
所 有 元 素 。 合 并 过 程 是 先 把 left 的 最 大 元 素 zx 伸展 到 树 根 ,此 时 树 根 z 没有 右 子 树 , 把 z 的 
右 子 树 接 到 right 的 根 ,就 完成 了 合并 。 

5. 删除 

把 待 删除 的 结 点 旋转 到 根 , 删 除 它 ,然后 合并 左 、 右 子 树 。 

下 面 的 例题 给 出 了 Splay 树 的 编程 细节 。 


hdu 1890“Robotic Sort” 
有 nn 个 数字 ,1 三 n 二 100 000, 用 一 个 机 械 臂 帮忙 排序 ,其 方法 如 图 5. 19 所 示 。 在 左 
图 中 (图 中 的 高 度 是 数字 大 小 ), 用 机 械 壁 夹 住 第 1 个 数 和 最 小 的 数 , 翻 转 , 变 成 中 图 的 样 
子 , 最 小 的 数 就 处 于 第 1 个 位 置 。 然 后 对 中 图 用 同样 的 方法 找 第 2 小 的 数 。 继 续 这 个 过 
程 直到 结束 。 


。79 。 
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民国 车 划 区 国 区 :| 攻 : 国 必 二 攻击 攻 滞 攻 : 汪 车 3 | 国 计 允 :局 攻 二 医 司 医 : 
和 2 中 2 € ) 
图 5.19 排序 方法 


输入 一 些 数 字 , 输 出 第 i 次 翻转 之 前 第 i 大 的 数 的 位 置 。 
输入 样 例 :345162 
输出 样 例 : 464566 


题目 的 基本 操作 是 找到 第 i 大 的 数 ,翻转 它 左 边 的 数 ( 不 包括 已 经 处 理 过 的 比 它 小 的 
数 ) ,右边 的 数 保持 不 变 。 如 果 用 模拟 法 编程 ,复杂 度 约 为 O(n ), 会 TLE。 本 题 需要 
Onlogsn) 的 方法 。 

注意 ,翻转 有 两 种 方法 ,这 里 以 第 1 次 翻转 345 1 为 例 : 方法 1, 直接 翻转 3 45 1; 方法 
2, 先 把 1 挪 到 最 左边 ,然后 翻转 3 4 5。 这 两 种 方法 的 结果 一 样 ,在 下 面 的 Splay 程序 中 适合 
用 第 2 种 方法 。 

本 题 的 操作 可 以 用 Splay 来 模拟 ,利用 了 Splay 树 能 把 结 点 旋转 到 根 的 功能 。 

下 面 以 第 1 个 数 的 处 理 为 例 来 说 明 过 程 。 

(1) 建树 。 把 这 个 序列 按 初始 位 置 建 一 个 二 又 搜索 树 。 图 5. 20(a) 是 建树 的 结果 ， 
圆圈 内 是 初始 位 置 ,圆圈 旁边 的 数字 是 题目 给 出 的 序列 。 根 据 中 序 遍 历 , 它 是 题目 的 样 
例 3 45 16 2。 建 树 的 代码 是 buildtree() 。 


(2 
4 


(a) 建树 (b) 旋转 到 根 (©) 处 理 左 子 树 的 翻转 (d) 删除 根 
图 5.20 hdu 1890 题 
(2) 用 Splay 旋转 到 根 。 找 到 最 小 的 数 ,用 Splay 把 它 旋转 到 根 。 其 左 子 树 的 大 小 就 是 
数列 中 排 在 它 左边 的 数 的 个 数 , 也 就 是 题目 的 输出 。 其 右边 的 数 的 顺序 保持 不 变 , 左 边 的 数 
需要 模拟 机 械 臂 的 翻转 。 旋 转 的 代码 是 splay() 。 
(3) 翻转 左 子 树 。 模 拟 题目 中 的 机 械 臂 翻 转 , 但 是 ,如 果 每 次 都 完全 翻转 左 子 树 , 时 间 
必然 超时 。 这 里 从 线段 树 ? 得 到 启发 ,用 标记 的 方式 记录 翻转 情况 ,减少 直接 操作 的 次 数 ， 


四 ”类似 线段 树 的 lazy 操作 , 见 本 书 中 的 “5. 3.4 区 间 修 改 ”。 
。80 。 
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等 Splay 操作 的 时 候 再 处 理 。 图 (c) 中 只 翻转 了 结 点 3, 对 结 点 3 做 标记 ,而 它 的 子 树 1、2 保 
持 不 变 。 标 记 的 代码 是 update_rev()。 注 意 ,翻转 会 改变 BST 树 的 有 序 结构 ,所 以 本 题 并 
不 是 Splay 树 的 裸 题 ,只 是 用 到 了 Splay 树 的 旋转 功能 。 在 下 面 给 出 的 代码 中 ,如 果 去 掉 
update_rev() ,就 是 纯粹 的 Splay 代码 。 

(4) 删除 根 , 即 在 树 上 删除 最 小 数 。 在 删除 过 程 中 ,根据 标记 进行 子 树 的 翻转 。 最 后 的 
结果 见 图 (d) ,这 是 去 掉 了 最 小 数 的 树 ,第 1 次 处 理 结束 。 删 除根 的 代码 是 del_root()。 

下 面 是 hdu 1890 的 代码 。 该 代码 中 去 掉 update_rev()、pushup()、pushdown(), 就 是 
纯 的 Splay 代码 。 


#include <bits/stdct+.h> 

using namespace std; 

const int maxn = 100010; 

int root; // 根 
int rev[maxn], pre[maxn], size[ maxn]; 

//rev[i], 标 记 i 被 翻转 ;pre[i],i 的 父 结 点 ;size[i],i 的 子 树 上 结 点 的 个 数 
int tree[maxn][2]; // 记 录 树 :tree[i][0],i 的 左 儿 子 ;tree[i][1],i 的 右 儿子 
struct node{ 

int val, id; 

bool operator <(const node &A)const { // 用 于 sort() 排 序 

if(val == A.val)return id<A. id; 
return val <A. val; 
}nodes[maxn]; 
void pushup( int x){ // 计 算 以 x 为 根 的 子 树 包含 多 少子 结 点 
size[x] = size[tree[x][0]] + size[tree[x][1]]+1; 
上 
void update_rev(int x){ 


if(!x)return; 
swap(tree[x][0], tree[x][1]); // 翻 转 x: 交 换 左右 儿子 
rev[x]^=1; // 标 记 x 被 翻转 
} 
void pushdown( int x){ // 在 做 Splay 时 ,根据 本 题 的 需要 , 处 理 机 械 臂 翻转 


if(rev[x]){ 
update_rev(tree[x][0]); 
update rev(tree[x][1]); 
rev[x] = 0; 
} 
} 
void Rotate( int x, int c){ // 旋 转 ,c= 0 为 左旋 ,c= 1 为 右 旋 
int y= pre[x]; 
pushdown(y); 
pushdown(x); 
tree[Y][!c] = tree[x][c]; 
pre[ltree[x][c]]=y; 
if(pre[y]) 
tree[pre[Y]][tree[pre[Y]][1] == y] = x; 
pre[x] = pre[y]; 
tree[x][c] =y; 


六 光 伯 汶 


算法 竞赛 入 门 到 进 阶 


pre[Y] =x; 
Pushup(Y) 7 
} 
void splay(int x, int goal){ 
// 把 结 点 x 旋转 为 goal 的 儿子 ,如 果 goal 是 0, 则 旋转 到 根 


pushdown(x); 


while(pre[x]!= goal){ // 一 直 旋 转 , 直到 x 成 为 goal 的 儿子 
if(pre[pre[x]] == goal){ // 情 况 (1) :x 的 父 结 点 是 根 , 单 旋 一 次 即 可 


pushdown(pre[x]); pushdown(x); 
Rotate(x, tree[pre[x]][0] == x); 

} 

else{ /人 x 的 父 结 点 不 是 根 
pushdown(pre[ pre[x]]); pushdown(pre[x]); pushdown(x); 
int y= pre[x]; 
int c= (tree[pre[Y]][0] == y); 


if(tree[y][c] == x){ // 情 况 (2) :x、x 的 父 、x 父 的 父 ,不 共 线 
Rotate(x, !c); 
Rotate(x, c); 

} 

elsef // 情 况 (3) :x、x 的 父 、x 父 的 父 , 共 线 


Rotate(y, c); 
Rotate(x, c); 


} 
} 
pushup(x); 
if(goal == 0) root = xi // 如 果 goal 是 0, 则 将 根 结 点 更 新 为 x 
} 
int get_max(int x){ 
pushdown(x); 
while(tree[x][1]){ 
x= tree[x][1]; 
pushdown(x); 
} 
return x; 
上 
void del_root(){ // 删 除根 结 点 
if(tree[root][0] == 0){ 
root = tree[ root][1]; 
pre[root] = 0; 
} 
else{ 
int m= get_max(tree[root][0]); 
splay(m, root); 
tree[m][1] = tree[root][1]; 
pre[tree[root][1]] = nm; 


root =m; 
pre[root] = 0; 
pushup( root); 
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void newnode( int &x, int fa, int val){ 
x= val; 
pre[x] = fa; 
size[x] =1; 
rev[x] = 0; 
tree[x][0] = tree[x][1] = 0; 
void buildtree( int &x, int 1, int r, int fa){ // 建 树 
if(1>r) return; 
int mid= (1+r)>>1; 
newnode(x, fa, mid); 
buildtree(tree[x][0],]1,mid— 1,x); 
buildtree(tree[x][1],mid+1,r,x); 
pushup(x); 
} 
void init(int n){ 
root == 0; 
tree[ root][0] = tree[ root][1] = pre[ root] = size[ root] = 0; 
buildtree(root, 1,n,0); 
} 
int main(){ 
int n; 
while(~scanf("%d",gn) && n){ 
init(n); 
for(int i=1;i<=n;it+){ 
scanf("%d",g&nodes[i].val); nodes[i].id=i; 
} 
sort(nodes +1,nodes+n+1); 
for(int i=1;i<n;it++){ 
splay(nodes[ i]. id, 0); // 第 次 翻转 :把 第 i 大 的 数 旋 到 根 
update_rev(tree[root][0]); ”// 左 子 树 需 要 翻转 
printf("%d",i+size[tree[root][0]]); 
//i: 第 i 次 翻转 ;size: 第 i 个 被 翻转 数 的 左边 的 个 数 ,就 是 它 左 子 树 的 个 数 
del_root(); // 删 除 第 i 次 翻转 的 数 ,准备 下 一 次 翻转 
} 
printf(" % d\n",n); 
} 
return 0; 


} 


读者 可 以 在 上 面 代 码 的 基础 上 写 出 Splay 树 常见 操作 的 代码 ,例如 

(1) 查找 z。 执 行 splayCz, 0), 即 把 zx 旋转 到 根 结 点 。 

(2) 删除 zx。 先 执 行 splayCz, 0) ,把 zx 旋 转 到 根 , 然 后 用 del_root() 删 除 它 。 

(3) 查找 最 大 、 最 小 .第 & 大 的 数 。 用 中 序 遍历 进 行 查找 ,查找 后 可 以 用 splay() 把 它 旋 
转 到 根 。 


【习题 】 


hdu 1622, 建 二 叉 树 ; 
hdu 3999 .二叉树 遍历 ; 
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hdu 3791,BST; 
hdu 4453,Splay 基本 题 ; 
hdu 3726 ,离线 处 理 十 Splay, 经 典 题 。 该 题 用 Treap 树 也 能 做 。 


5.3 线 段 树 


有 这 样 一 类 RMQ(Range Minimum/Maximum Query) 问 题 , 求 区 间 最 大 值 或 最 小 值 。 
设 有 长 度 为 n 的 数列 {a ,as，,…,a,}) ,需要 进行 以 下 操作 。 

(1) 求 最 值 : 给 定 i,j<n, 求 {a;,…,aj} 区 间 内 的 最 值 。 

(2) 修改 元 素 : 给 定 上 和 ,把 a 改 成 工 。 

如 果 用 普通 数组 存储 数列 ,上 面 两 个 操作 中 , 求 最 值 的 复杂 度 是 O(z) ,修改 是 0(1)。 
如 果 有 m 次 “修改 元 素 十 查询 最 值 ”, 那 么 总 复杂 度 是 O(mn)。 如 果 m 和 比较 大 ,例如 
100 000 以 上 ,那么 整个 程序 的 复杂 度 是 1028 的 数量 级 。 这 个 复杂 度 在 竞赛 中 是 不 可 承 
受 的 。 

除了 RMQ 问题 以 外 ,类 似 的 还 有 求 区 间 和 问题 。 对 于 数列 (a1 ,az ,…',a,}, 先 更 改 某 
些 数 的 值 ,然后 给 定 i,j 三 nn, 求 sum 二 aj; 十 … 十 a; 的 区 间 和 。 对 于 单个 更 改 或 者 求 和 ,很 容 
易 写 出 O(n) 的 算法 ; 如 果 更 改 和 询问 的 操作 总 次 数 是 m, 那么 整个 程序 的 复杂 度 是 
OGmn)。 和 RMQ 一 样 ,这 样 的 复杂 度 也 是 不 行 的 。 

对 于 这 类 问题 ,有 一 种 神奇 的 数据 结构 ,能 在 Ol(mlogzn) 的 时 间 内 解决 ,这 就 是 线段 树 。 


5.3.1 线段 树 的 概念 


线段 树 是 一 种 用 于 区 间 处 理 的 数据 结构 ,用 二 叉 树 来 构造 。 i 
线段 树 是 建立 在 线段 (或 者 区 间 ) 基 础 上 的 树 , 树 的 每 个 结 点 代表 一 条 线 回 


段 [L,R]。 图 5. 21 所 示 为 是 线段 [1,5] 的 线段 树 。 下 
了 考查 每 个 线段 [L,R],L 是 左 子 结 点 ,有 是 右 子 结 点 。 
CD 工 一 R, 说 明 这 个 结 点 只 有 -一 个 点 , 它 就 是 一 个 叶 


[1,3] [4.5] 子 结 点 。 

1 LR, 说 明 这 个 结 点 代表 的 不 止 一 个 点 , 它 有 两 
过 ~ 个 儿子 , 左 儿子 代表 的 区 间 是 [L, M], 右 儿子 代表 的 区 间 
是 LM 二 1, RJ, 其 中 M=(L 十 R)/2。 

图 5.21 线段 [1, 5] 的 线段 树 结构 线段 树 是 二 又 树 ,一 个 区 间 每 次 被 折 一 半 往 下 分 ,所 

以 最 多 分 logsn 次 就 到 达 最 低层 。 当 需要 查找 一 个 点 或 

者 区 间 的 时 候 , 顺 着 结 点 往 下 找 ,最 多 log:z 次 就 能 找到 。 这 就 是 线段 树 效率 高 的 原因 ,使 
用 了 二 又 树 折 半 查找 的 方法 。 

回 到 RMQ 问题 ,如 果 用 线段 树 ,“ 修 改元 素 十 查询 最 值 ”* 这 两 个 操作 分 别 可 以 在 

Odogzn) 的 时 间 内 完成 。 如 图 5. 22 所 示 , 查 询 {1,2,5,8,6,4,3} 的 最 小 值 ,其 中 每 个 结 点 上 
的 数字 是 这 棵 子 树 的 最 小 值 。 


[1.1] [2.2] 
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Es - 
Ni 了 从 


[1 日 | [4] [3] 
Fa 
0] [2 G5] [8] [6] 中 B] 
图 5. 22 RMQ 问题 (查询 最 小 值 ) 
如 需 修改 元 素 ,直接 修改 叶子 结 点 上 元 素 的 值 后 从 底 往 上 更 新 线段 树 , 操 作 次 数 也 是 
O(logsn) 。 


m 次 “修改 十 查询 ”的 总 复杂 度 是 O(mlogsnlogzn)。 实 际 上 ,修改 和 查询 可 以 同时 做 ， 
所 以 总 复杂 度 是 Ol(mlogsn)。 这 对 规模 100 万 的 问题 也 能 轻松 解决 。 


5.3.2 点 修改 


首先 讨论 在 线段 树 中 每 次 只 修改 一 个 点 的 问题 。 
线段 树 如 何 构造 ? 如 何 更 新 ? 如 何 查询 ? 下面 以 poj 2182 为 例 ,引导 出 线段 树 的 应 用 
和 编程 细节 。 


poj 2182 “Lost Cows” 
题目 描述 : 有 编号 是 1~n 的 nn 个 数字 ,2 之 n 三 8000, 乱 序 排 列 ,顺序 是 未 知 的 。 对 
于 每 个 位 置 的 数字 ,知道 排 在 它 前 面 比 它 小 的 数字 有 多 少 个 。 求 这 个 乱 序 数列 的 顺序 。 


例如 有 5 个 数 ,已 知 每 个 数字 前 面 比 它 小 的 数 的 个 数 ,分 别 是 : 

pre[]: 01210 

可 以 求 得 这 个 乱 序 排列 是 : 

al |] 24531 

本 题 是 “简单 题 ”, 用 线段 树 或 者 树 状 数组 实现 。 

在 讲解 后 续 内 容 之 前 ,这 里 先 用 暴力 法 实现 ,思路 是 从 后 往 前 处 理 pre[ ]: 

(1) pre[5j==0, 表 示 ans[5] 前 面 比 它 小 的 数 有 0 个 , 即 ans[5j 是 最 小 的 ,在 1~5 这 几 
个 编号 中 1 最 小 ,所 以 ans[5] 二 1。ans[L] 的 前 4 个 编号 不 再 包括 1, 剩 下 2 一 5 这 几 个 编号 。 

(2) pre[L4] 王 1, 在 剩 下 的 2 一 5 这 几 个 编号 中 ,编号 3 是 第 2 大 的 ,所 以 ans[4]==3。 

(3) pre[3] 王 2 ,在 剩 下 的 2.4.5 这 几 个 编号 中 ,编号 5 是 第 3 大 的 ,所 以 ans[3]==5。 

(4) pre[L2] 一 1, 在 剩 下 的 2、4 这 两 个 编号 中 ,编号 4 是 第 2 大 的 ,所 以 ans[2] 一 4。 

(5) pre[1] 二 0, 剩 下 的 编号 2,ans[1] 二 2。 

概括 以 上 步骤 ,在 每 一 步 , 剩 下 的 编号 中 第 pre[n] 十 1 大 的 编号 就 是 ans[nj。 

用 暴力 的 方法 ,从 pre[] 示 尾 往 前 计算 ,每 处 理 一 头 牛 后 ,需要 把 剩 下 的 牛 重新 排名 , 重 
新 排名 的 计算 时 间 是 O(0z); 在 重新 排名 时 ,可 以 顺便 做 下 一 次 的 查找 ,所 以 不 需要 另外 算 
查找 的 时 间 。 一 共有 nn 头 牛 ,总 复杂 度 是 O(n*)。 本 题 的 数据 规模 不 大 ,只 有 8000, 用 暴 
力 的 方法 也 能 通过 。 
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在 下 面 的 代码 中 ,pre[] 是 输入 的 1 一 n 个 数字 ,例如 {0 1 2 1 0}; ans[] 是 答案 ,例如 
{2 4 5 3 1); num[ 记录 被 处 理 过 的 数字 ,被 处 理 后 的 数字 置 为 一 1。 例 如 num[] 的 初始 值 
是 {1 2 3 4 5} ,得 到 ans[5] 二 1 后 ,num[ ] 更 新 为 {一 1 2 3 4 5} ,这 里 用 一 1 表示 1 这 个 数字 
已 经 用 过 了 。 

解 题 的 关键 是 ,在 剩 下 的 编号 中 ,第 pre[ 站 十 1 个 数字 就 是 ans[n]。 

下 面 是 代码 。 


poj 2182 的 暴力 法 代码 


# include < stdio.h> 

const int Max = 8005; 

int main(){ 
3 
int pre[ Max], ans[Max], nunm[Max]; // 数 组 的 第 0 个 都 不 用 ,从 第 1 个 开始 用 
scanf("%d", gn); 


pre[1] = 0; 
for(i=1; i<=n; i++) num[i] = i; 
for(i = 2; i<=n; i++) scanf("%d", gpre[i]); 
for(i = ni i>=1;i--)f{ // 从 后 往 前 处 理 数列 
k=0; 
for(j=1; j<=n; j++) // 查 找 num[ ] 中 未 处 理 的 第 pre[i] + 1 大 的 数 
if(num[j] !:= -1) { 


| 
if(k == pre[i]+1){ // 找 到 了 
ans[i] = num[j]; //num[] 中 剩 下 的 第 pre[i] + 1 个 数 就 是 ans[i] 
num[j] = -1; 
break; 


. 
lj 
for(i = 1; i<=n; i++) printf("%d\n", ans[i]); 
return 0; 


} 


当 n 更 大 时 ,Ow ) 会 TLE, 必 须 用 更 优 的 算法 。 问 题 的 关键 是 ,如 何 高 效 地 对 剩 下 的 
牛 重新 排名 。 

这 里 引入 高 级 数据 结构 “线段 树 ”, 可 以 在 O(logsn) 的 时 间 内 完成 一 次 重新 排名 。 下 面 
说 明 其 要 点 。 


1. 用 二 叉 树 建立 线段 树 


PS 用 二 又 树 的 方法 ,把 牛 分 成 不 同 的 组 。 在 图 5. 23 中 ， 

村， 叶子 结 点 内 的 数字 是 后 的 编号 ,其 他 结 点 是 咎 的 编号 范围 

| LU 入 ， 例 如 根 结 点 ,包含 5 头 牛 , 它 的 左 子 结 点 有 3 头 牛 , 右 子 结 
[5 


J 有 间 区 ] 点 有 两 头 牛 。 
" 问 2. 存储 空间 
图 5.23 初始 线段 村 如 果 牛 有 ， 头 ,这 个 二 又 树 的 结 点 总 数 在 编程 时 为 
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4n。 请 读者 自己 思考 为 什么 是 4x( 在 后 面 的 程序 注释 中 有 答案 ) 。 

3. 查询 和 更 新 

(1) 第 1 次 处 理 pre[5] 二 0, 即 找 对 应 的 第 1 头 牛 ,如 图 5. 24(a) 所 示 。 步 又 是 从 根 结 点 
开始 ,逐步 找到 左下 角 , 即 编号 为 1 的 结 点 ,得 到 ans[5] 王 1。 在 这 个 过 程 中 ,更 新 经 过 的 每 
个 结 点 , 即 把 这 个 结 点 剩 下 的 牛 的 数量 减 一 。 一 共 需 要 更 新 4 个 结 点 。 左 下 角 结 点 已 经 减 
到 0, 表 示 后 面 的 计算 需要 排除 它 。 


5 5 一 4 一 3 
1,5 村 
3232 S 2 有 SS 2 
[1,3] [4,5] [1,3] [4,5] 
4 省 je YH 3 和 i YY 
120, a Ne 


1 
[1 D] [ul [ea 
(a) 处 理 pre[5]=0 (b) 处 理 pre[4]=1 
图 5.24 线段 树 的 查询 和 更 新 


(2) 第 2 次 处 理 pre[4] 二 1, 即 找 剩 下 的 第 2 头 牛 ,如 图 5.24(b) 所 示 。 步 又 是 从 根 结 点 
开始 ,逐步 找到 左边 第 3 个 结 点 ,得 到 ans[5] 二 3。 更 新 经 过 的 每 个 结 点 ,一 共 更 新 3 个 


(3) 依次 处 理 , 直 到 结束 。 

4. 复杂 度 

每 次 处 理 , 从 二 叉 树 的 根 结 点 开始 到 最 下 一 层 , 最 多 需要 更 新 logs4n 个 结 点 ,复杂 度 是 
O(logsn); 一 共有 nn 头 牛 需要 处 理 ,总 复杂 度 是 O(nlogsn)。 在 暴力 法 中 ,每 次 需要 查询 和 
更 新 n 个 序列 中 的 每 个 数 ,复杂 度 为 O(n)。 线 段 树 把 个 数 按 二 叉 树 进行 分 组 ,每 次 更 新 
有 关 的 结 点 时 ,这 个 结 点 下 面 的 所 有 子 结 点 都 隐 含 被 更 新 了 ,从 而 大 大 地 减少 了 处 理 次 数 。 

下 面 给 出 poj 2182 的 线段 树 代码 。 

poj 2182“ 用 结构 体 实现 线段 树 ” 


# include < stdio.h> 
using namespace std; 
const int Max = 10000; 


struct{ 
int 1, r, len; // 用 len 存储 这 个 区 间 的 数字 个 数 , 即 这 个 结 点 下 牛 的 数量 
}tree[4 x Max]; // 这 里 是 4 倍 ,因为 线段 树 的 空间 需要 


int pre[ Max], ans[Max]; 
void BuildTree( int left，int right，int u){ // 建 树 
tree[u].1 = left; 
tree[u].r = right; 
tree[u].len = right — left + 1; // 更 新 结 点 u 的 值 
if(left == right) 
return; 
BuildTree(left, (left+right)>1, u<<1); // 递 归 左 子 树 
BuildTree(((left+ right)>>1) + 1，right，(u<<1) + 1); // 递 归 右 子 树 


二 


算法 竞赛 入 门 到 进 阶 


} 


int query( int u, int num){ // 查 询 + 维护 ,所 求 值 为 当前 区 间 中 左 起 第 non 个 元 素 
tree[u]. len -——; // 对 访问 到 的 区 间 维 护 len, 即 把 这 个 结 点 上 牛 的 数量 减 一 


if(tree[u].1 == tree[u].r) 
return tree[u].1; 
// 情 况 1: 左 子 区 间 内 牛 的 个 数 不 够 , 则 查询 右 子 区 间 中 左 起 第 num - tree[u<< 1]. len 个 元 素 
if(tree[u<<1].1en< num) 
return query((u<<1) + 1，num - tree[u<<1].1en); 
// 情 况 2: 左 子 区 间 内 牛 的 个 数 足 够 ,依旧 查询 左 子 区 间 中 左 起 第 num 个 元 素 
if(tree[u<<1].1len>= num) 
return query(u <<1, num); 
. 
int main(){ 
i 
scanf("%d", gn); 
pre[1] = 0; 
for(i = 2; i<=n; i++) 
scanf(" %d", gpre[i]); 
BuildTree(1, n, 1); 
for(i a mie T=} // 从 后 往 前 推断 出 每 次 最 后 一 个 数字 
ans[i] = query(1, pre[i] +1); 
for(i = 1; i<=n; i++) 
printf(" % d\n", ans[i]); 
return 0; 


} 


5. 用 完全 二 又 树 实现 线段 树 
在 上 面 的 例子 中 ,线段 树 是 一 棵 普通 的 二 又 树 ,操作 起 来 比较 麻烦 。 其 实 可 以 用 完全 二 
叉 树 的 结构 来 实现 ,编程 更 加 简单 ,如 图 5. 25 所 示 。 


5 一 共 5 头 牛 
[1] 
4 了 sa 1 
[2 [3] 
[4] Dw Dw 
SS 
[8] [9] [10] 0 02] [13] [14] [15] 
1 | 1 1 1 0 0 0 


图 5.25 用 完全 二 叉 树 建 线段 树 


该 图 中 的 最 后 一 行 是 牛 的 编号 ,例如 [8] 对 应 1 号 牛 ,[9] 对 应 2 号 牛 ,等 等 。 一 共有 5 
小 后: 

在 使 用 完全 二 又 树 时 ,最 后 一 层 会 存在 “ 空 叶子 ”。 同 样 给 空 叶子 按 顺序 编号 ,在 遍历 线 
段 树 时 根据 判断 条 件 跳 过 这 些 “ 空 叶子 "就 好 了 。 用 完全 二 叉 树 的 方式 存储 线段 树 能 提高 插 
人 线段 和 搜索 时 的 效率 。 父 结 点 p 的 左 、 右 子 结 点 分 别 是 p x2、p * 2 十 1, 用 这 样 的 索引 方 
式 检索 p 的 左 、 右 子 树 比 用 指针 快 。 
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poj 2182“ 用 完全 二 叉 树 实现 线段 树 ” 


#include < stdio.h> 
# include < math.h> 
const int Max = 10000; 
int pre[Max] = {0}, tree[4* Max] = {0},ans[Max] = {0}; 
//tree 是 用 数组 实现 的 满 二 又 树 .从 图 5. 25 可 以 知道 ,需要 4 倍 大 的 空间 
void BuildTree( int n, int last_left){ // 用 完全 二 叉 树 建 一 个 线段 树 
int i; 
for(i= last left;i<last left+nii++) 
// 给 二 叉 树 的 最 后 一 行 赋值 , 左边 5 个 结 点 是 n 头 牛 
tree[i]=1; 
while(last left != 1) { // 从 二 叉 树 的 最 后 一 行 倒 推 到 根 结 点 , 根 结 点 的 值 是 牛 的 总 数 
for(i= last left/2; i<last left; i++) 
tree[i] = tree[ix2]+tree[ix*x2+1]; 
last left= last left/2; 
} 
int query(int u, int num, int last left){ 
// 查 询 + 维护 ,关键 的 一 点 是 所 求 值 为 当前 区 间 中 左 起 第 num 个 元 素 
tree[u] ——; // 对 访问 到 的 区 间 维 护 剩 下 的 牛 的 个 数 
if(tree[u] == 0 && u>= last left) 
return u; 
// 情 况 1: 左 子 区 间 的 数字 个 数 不 够 , 则 查询 右 子 区 间 中 左 起 第 num - tree[u<<1] 个 元 素 
if(tree[u<<1] < num) 
return query((u<<1) +1, num - tree[u<<1], last_ left); 
// 情 况 2: 左 子 区 间 的 数字 个 数 足够 ,依旧 查询 左 子 区 间 中 左 起 第 num 个 元 素 
if(tree[u<<1] >= num) 
return query(u<< 1，num, last_left) 
) 
int main(){ 
int n, last_left, i; 
scanf("%d", &n); 
pre[1] = 0; 
last_left = 1<<(int(log(n)/l0g(2)) +1); 
// 二 叉 树 最 后 一 行 的 最 左边 一 个 .计算 方法 是 找 离 n 最 近 的 2 的 指数 ,例如 3->4, 4->4, 5->8 
Tor(t = 2 1 Lh) 
scanf("%d", &pre[i]); 
BuildTree(n, last_left); 
for(i = n; i>=1; i-—) // 从 后 往 前 推断 出 每 次 最 后 一 个 数字 
ans[i] = query(1, pre[i] +1,1ast left)— last left + 1; 
for(i = 1; i<=n; i++) 
printf(" % d\n", ans[i]); 
return 0; 


5.3.3 离散 化 


建 二 又 树 是 线段 树 的 基本 操作 ,但 是 二 叉 树 的 大 小 并 不 是 无 限制 的 ,例如 规模 10 000 000 
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以 上 的 二 叉 树 会 超过 人 允许 的 存储 空间 。 在 竞赛 中 如 果 出 现 结 点 规模 这 样 大 的 题目 ,当然 不 
能 在 程序 中 建 这 么 大 的 二 又 树 ,此 时 需要 用 “离散 化 ”这 种 小 技巧 来 解决 。 

离散 化 就 是 把 原 有 的 大 二 又 树 压缩 成 小 二 又 树 ,但 是 压缩 前 后 子 区 间 的 关系 不 变 。 

例如 一 块 宣传 栏 , 横 向 长 度 的 刻度 标记 为 1 到 10, 贴 4 张 不 同 颜色 的 海报 ,它们 的 宽度 

宣传 栏 等 宽 , 长 度 分 别 是 [1,3]、[2,5]、[L3,8]、L3,10], 并 且 用 后 者 覆盖 前 者 , 问 最 后 能 看 

见 几 种 颜色 的 海报 。 

离散 化 步骤 如 下 : 

(1) 提取 这 4 张 海 报 的 8 个 端点 : 1 3 2538310 

(2) 排序 并 且 删 除 相 同 的 端点 ,得 到 : 1 23 5 8 10 

(3) 把 原 线段 的 8 个 端点 映射 到 新 的 线段 上 : 


8 
$ 
下 人 i 霹 


新 的 4 个 海报 为 [1,3]、[2,4]、[3,5]、[3,6], 覆 盖 关 系 没有 改变 。 新 的 宣传 栏 长 度 是 1 
到 6, 即 宣传 栏 的 长 度 从 10 压缩 到 6。 

离散 化 的 压缩 比 是 很 可 观 的 。 例 如 原 线 段 树 的 区 间 长 度 是 10 000 000 ,而 其 中 真正 用 
到 的 子 区 间 是 100 000 ,那么 子 区 间 的 端点 最 多 有 2X100 000 个 。 经 过 离散 化 压缩 后 ,新 的 
线段 树 区 间 是 200 000 ,压缩 率 是 200 000/10 000 000= 二 2%。 


【习题 】 
poj 2528 ,题目 中 宣传 栏 的 长 度 是 10 000 000。 
5.3.4 区 间 修 改 


上 面 的 例子 都 是 只 修改 线段 树 上 的 某 个 点 。 区 间 修 改 是 更 复杂 的 问题 。 给 定 n 个 元 素 
{ai ,az ，…,an} ,进行 以 下 操作 : 

加 : 给 定 i,j 志 nn, 把 {a;,…,aj) 区 间 内 的 值 全 部 加 vw。 

查询 : 给 定 上 ,Rn, 计 算 {ar ,…,ar) 的 区 间 和 。 

下 面 以 poj 3468 为 例 来 讲解 区 间 修改 问题 。 


poj 3468 “A Simple Problem with Integers” 
给 出 NN 个 数 ,进行 Q@ 个 操作 ,1 三 N, Q 到 100 000。 有 两 种 操作 : 
“Cabc”, 对 区 间 [a,b] 的 每 个 数字 加 cc; 
“Q ab”, 查 询 区 间 [a,65] 的 数字 和 。 
输入 : N, Q, 以 及 NN 个 数字 ,Q 个 操作 ; 
输出 : 对 每 个 查询 操作 ,输出 结果 。 


如 果 用 暴力 方法 ,直接 对 这 个 数 进行 操作 ,那么 每 个 C 操 作 和 Q 操作 都 是 OCz) 的 ， 
一 共有 Q 次 操作 ,总 复杂 度 是 O(n ) 。 
如 果 用 前 面 的 修改 线段 树 点 的 方法 ,在 做 C 操作 时 ,对 区 间 里 的 数 一 个 一 个 进行 修改 ， 
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一 个 数 的 修改 是 O(logzn) 的 ,区 间 修 改 合 起 来 是 O(nlogzn),Q 次 操作 的 总 复杂 度 是 
O(logzn), 比 暴力 法 还 要 差 。 

lazy-tag 方法 。 此 时 可 以 采用 一 种 “懒惰 (lazy)” 的 做 法 。 当 修改 的 是 一 个 
整 块 区 间 时 ,只 对 这 个 线段 区 间 进 行 整体 上 的 修改 ,其 内 部 每 个 元 素 的 内 容 先 不 
做 修改 ,只 有 当 这 部 分 线段 的 一 致 性 被 破坏 时 才 把 变化 值 传递 给 子 区 间 。 那 么 ， 


[Oh 


每 次 区 间 修 改 的 复杂 度 是 O(logzn) ,一 共有 Q 次 操作 ,总 复杂 度 是 O(nlogzn)。 ne A 
做 lazy 操作 的 子 区 间 ,需要 记录 状态 (tag) ,在 下 面 的 代码 中 用 add[ 实现 。 视频 讲解 


下 面 描述 具体 步骤 。 


(1) 初始 化 时 建树 。 以 区 间 [1, 10] 为 例 建树 ,图 5. 26 所 示 为 结果 。 在 最 后 的 叶子 上 是 
1 一 10 这 10 个 数字 。 图 中 最 底层 有 很 多 叶子 是 空 的 。 每 个 结 点 右上 角 的 数字 是 以 它 为 根 


结 点 的 这 棵 子 树 的 区 间 和 。 
本 ss 


[4.5] 45 [6, oT 
2 SS 
[1,3 从 51? [68] [9,10] 
4 
AN ， AS 
[012] [33] [4,4] [55] [6.7] [8.8]” [9.9] [10,10] 
a 9 0 1 12 13 14 15 
LPTs 
16 17 18 19 20 21 2 23 24 25 向 27 8 动 和 玉 


5.26 初始 化 建树 


(2)“C abc? 操 作 。 例 如 “C 3 6 3”, 在 [3, 6] 区 间 内 ,把 每 个 元 素 加 3。 从 根 结 点 开始 ， 
用 递归 在 子 树 中 找 区 间 [3, 6], 有 两 种 情况 : [3, 6] 与 子 区 间 交 错 ` [3, 6] 包 含 子 区 间 。 例 
如 子 区 间 [1, 5J 和 [6, 10] 都 与 [3,6] 交 错 ,需要 继续 深入 更 底层 子 区 间 。 在 子 区 间 [4,5]， 
它 被 [3, 6] 包 含 ,那么 根据 lazy 原理 ,把 这 个 子 区 间 进 行 整体 修改 ,不 继续 深入 , 它 下 一 层 的 


[4, 4 和 [5, 5j 的 区 间 和 不 用 修改 。 图 5. 27 所 示 为 结果 。 部 分 结 点 的 区 间 和 发 生 了 改变 ， 
见 右上 角 。 


[i 4 [G0 ”” 


[3 [4.5] [6.8] 7 4 [9,10]'? 

~ ZR pa 7 

2 B36 [4 Ss [693 [as] 09990010 
者 9 10 17 处 于 13 15 

1 TE 66 fo i Bd Ed Ll 
16 77 18 19 20 21 24 25 26 P+ 28 29 30 31 


图 5.27 区 间 求 和 
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(3)“Q ab”。 同 样 可 以 利用 lazy 原理 , 当 某 个 子 区 间 包 含 在 被 查询 的 区 间 内 时 ,直接 
返回 这 个 子 区 间 的 区 间 和 ,不 用 继续 深入 。 

下 面 是 poj 3468 的 程序 。build() 函数 建树 ,建树 的 结果 见 图 5.27; update() 函数 完 
“C ab c ”操作 ,query() 函 数 完成 “Q a 5” 操作 。 

sum[ 记 记录 结 点 i 的 区 间 和 ,在 图 5. 27 中 是 结 点 右上 角 的 数字 。 

add[ 让 是 tag, 它 记录 结 点 i 是 否 用 到 lazy 原理 ,其 值 是 *C a5c” 中 的 c; 如 果 做 了 多 次 
lazy,add[ 让 可 以 累加 。 一 旦 结 点 i 在 某 次 *C ap c” 中 被 深入 ,破坏 了 lazy, 就 把 add[ 门 归 
零 ,push_down() 函 数 完成 这 一 任务 。 


# include < stdio.h> 
using namespace std; 
const int MAXN = le5 + 10; 


long long sum[ MAXN << 2], add[MAXN << 2]; //4 倍 空间 

void push_up(int rt){ // 向 上 更 新 ,通过 当前 结 点 rt 把 值 递归 到 父 结 点 
sum[rt] = sum[rt <<1] + sum[rt <<1 |1]; 

} 

void push_down(int rt, int m){ // 更 新 rt 的 子 结 点 
if(add[rt]){ 


add[rt << 1] += add[rt]; 
add[rt <<1 | 1] += add[rt]; 
sum[rt <<1] += (m - (m>>1)) * add[rt]; 
sum[rt <<1|1] += (m>>1) * add[rt]; 
add[rt] = 0; // 取 消 本 层 标 记 
} 
} 
#define lson 1, mid, rt <<1 
#define rson mid + 1, r, rt<<1|1 
void build(int 1, int r, int rt){ // 用 满 二 叉 树 建树 
add[rt] = 0; 
if(1 == r){ // 叶 子 结 点 ,赋值 
scanf("%1]ld", &sum[rt]); 
return; 
} 
intmid = (1 + r)>1; 
build(lson); 
build(rson); 
push_up(rt); // 向 上 更 新 区 间 和 
} 
void update( int a, int b, long long c，int 1, int r, int rt){ // 区 间 更 新 
if(a<=1 &g& b>=r){ 
tl 和 本 首相 
add[rt] += ci; 


return; 
} 
push down(rt,r — 1 + 1); // 向 下 更 新 
intmid = (1 + r)>1; 
if(a<=mid) update(a, b, c, lson); // 分 成 两 半 , 继 续 深入 
if(b > mid) update(a, b, c, rson); 
push_up(rt); // 向 上 更 新 
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long long query(int a, int b, int 1, int r, int rt){ 


. 


if(a<=1 && b>=r) return sum[rt]; 
heh domn(rt, r = 1 + 1T)s 

int mid = (1 + r)>1; 

long long ans = 0; 

if(a<=mid) ans += query(a, b, lson); 
if(b> mid) ans += query(a, b, rson); 
return ans; 


int main(void){ 


int n, m; 
scanf("%d%d", gn, gm); 
build(1, n, 1); 
while(m—— ){ 
char str[2]; 
int ay b; long long c¢; 
scanf("%s", str); 
if(str[0] == 'C'){ 
scanf("%d%d% lld", &a, &b, &c); 
update(a, bc, 1, n, 1); 
}else{ 
scanf("%d%d", &a, &b); 


printf("%1ld\n", query(a, b, 1, ny 1)); 


构 


// 区 间 求 和 
// 满 足 lazy, 直接 返回 值 
// 向 下 更 新 


5.3.5 ”线段 树 习题 


简单 题 ; 


中 等 题 : 


hdu 1166/1394/1698/1754/2795; 


poj 1195/2182/2299/2828/2352/2750/2886/2777/3264/3468 。 


hdu 1540/1823/4027/5869; 
poj 2155/2528/2823/3225。 


: hdu 1255/1542/3642/3974/4578/4614/4718/5756/4441 。 


5.4 树 状 数组 


树 状 数组 (Binary Indexed Tree,BIT) 是 一 种 利用 数 的 二 进 制 特征 进行 检索 的 树 状 结 
树 状 数组 是 一 种 奇妙 的 数据 结构 ,不仅 非常 高 效 , 而 且 代码 极其 简洁 。 


1 


树 状 数组 的 概念 


从 下 面 这 个 例子 引导 出 树 状 数组 的 概念 。 


长 
1 


度 为 n 的 数列 {a1 ,as，,…,a,} ,进行 以 下 操作 。 
) 修改 元 素 add(k,zx): 把 a 加 上 之 。 


(2) 求 和 sum(z): Xx 二 ns,sum 王 qi 十 qz 十 … 十 az。 那 么 ,区 间 和 aj; 十 … 十 aj 二 sum(j) 一 


sum(i—1)。 
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这 个 程序 很 好 写 ,用 循环 加 或 者 前 级 和 ,复杂 度 是 O(n)。 然 而 ,如 果 n 很 大 ,这 样 做 的 
效率 会 非常 低 。 读 者 可 以 用 前 面 讲 的 线段 树 来 实现 高 效 的 算法 。 其 实 有 一 种 更 好 的 数据 结 
构 , 即 树 状 数组 ,不 仅 效率 和 线段 树 一 样 高 .只 有 O(log:z) ,而 且 代 码 短 得 不 可 思议 。 先 看 


一 看 代码 : 


#define lowbit(x) 


void add(int x, int d) { 
while(x<=n) { 


} 
上 


int sum( int x) { 


int sum = 0; 
while(x> 0){ 
sum += tree[x]; 
x -= lowbit(x); 


} 


return sum; 


} 


tree[x] += d; 
x += lowbit(x); 


((x) & — (x)) 


// 更 新 数组 tree[ ]。ax = ax + d 修改 和 as 有 关 的 tree[ ] 


// 求 和 :sum=a +as+ 


+a 


add() 和 sum() 的 复杂 度 都 是 O(logzn)。 


上 述 代码 的 使 用 方法 如 下 : 


(1) 初始 化 ,add()。 先 清空 数组 tree[] ,然后 读 取 a ,as，…,a,, 用 add() 逐 一 处 理 这 
个 数 ,得 到 tree[ ] 数 组 。 在 程序 中 并 不 需要 定义 数组 a[] ,因为 它 隐 含 在 tree[] 中 。 
(2) 求 和 ,sum()。 计 算 sum 二 后 十 qz 十 … 十 az, 即 执行 sum()。 求 和 是 基于 数组 


tree[] 的 。 


(3) 如 果 需 要 修改 元 素 ,执行 add(), 即 修改 数组 tree[ ]。 
下 面 详细 说 明 上 述 操作 的 原理 。 


2. lowbit() 操 作 

从 代码 中 可 以 看 出 ,其 核心 是 一 个 神奇 的 lowbit(Cz) 操 作 。lowbit(z) 一 
工 也 一 z, 功 能 是 找到 * 的 二 进 制 数 的 最 后 一 个 1。 其 原理 是 利用 负数 的 补 码 
表示 , 补 码 是 原 码 取 反 加 一 。 例 如 zx 一 6 一 00000110, ,一 + 三 x 三 11111010,， 


回 司 让 
视频 讲解 


那么 lowbit(z) 一 z && 一 zx 一 10: 一 2。 
1 一 9 的 lowbitO 〇 结果 如 表 5. 1 所 示 。 
表 5.1 1~9 的 lowbit() 结 果 
1 2 3 4 5 6 7 8 9 
工 的 二 进 制 1 10 11 100 101 110 111 1000 1001 
lowbit(x) 1 2 1 4 1 2 1 8 1 
4 8 
tree[1]| tree[2]| tree[3] eel tree[5]| tree[6]| tree[7] treeL8] tree[ 9] 
tree[Lz] 数 组 一 al 十 az 一 al 十 az 
=a | 一 aa 十 az ‘Se =as |=as+as 一 a7 一 as 
十 as 十 as 十 … 十 as 
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lowbit(z) 有 什么 用 呢 ? 从 lowbit(z) 引 出 一 个 tree[ ] 数 组 ,所 有 的 计算 都 围绕 tree[ ] 
进行 。 

令 x 二 lowbit(x) ,定义 tree[x] 的 值 ,是 把 a; 和 它 前 面 共 m 个 数 相 加 的 结果 ,如 表 5. 1 
所 示 。 例 如 lowbit(6) 二 2,tree[6] 二 as 十 os。 

图 5. 28 中 的 横 线 重新 描述 了 这 个 关系 , 横 线 中 的 黑色 表示 tree[Lx], 它 等 于 横 线 上 元 素 
相 加 的 和 。 


lowbit()=8 

lowbitO=4 

lowbit0=2 [ 

lowbitO=1 一 他国 a eg [| 
tree[] 1 过 3 地 


图 5. 28 lowbit() 计 算 


求 和 计算 以 及 tree[ 数组 的 更 新 都 可 以 通过 lowbit() 完 成 。 
1) 求 和 计算 sum 王 al; 十 oz 十 … 十 ax 
可 以 借助 tree[ 数组 求 sum, 例 如 : 
sum(8) 一 tree[8] 
sum[7]==tree[7] 十 tree[6] 十 tree[4] 
sum[9]==tree[9] 十 tree[ 8] 
然而 ,如 何 得 到 上 面 的 关系 呢 ? 
很 容易 观察 到 ,在 计算 sum 时 ,对 tree[] 的 查找 可 以 通过 lowbit(z) 实 现 。 例 如 sum[L7] 一 
tree[7] 十 tree[6] 十 tree[ 4]。 
首先 从 7 开始 ,加 上 tree[7]; 
然后 7 一 lowbit(7) 一 6, 加 上 tree[6]; 
接着 6 一 lowbit(6) 一 4, 加 上 tree[4]; 
最 后 4 一 lowbit(4) 一 0, 结束 。 
编程 细节 见 前 面 的 求 和 函数 sum() ,复杂 度 是 O(logsn)。 
2) tree[ ] 数 组 的 更 新 
更 改 a; ,那么 和 它 相 关 的 tree[ ] 都 会 变化 。 例 如 改变 os ,那么 tree[3] ,treeL4] \tree[L8] 
等 都 会 改变 。 同 样 ,这 个 计算 也 利用 了 lowbit(Cz) 。 
首先 更 改 treeL3]; 
然后 3 十 lowbit(3) 二 4, 更 改 tree[ 4]; 
接着 4 十 lowbit(4) 二 8, 更 改 tree[8]; 
继续 ,直到 最 后 的 tree[nj。 
编程 细节 见 函 数 add() ,复杂 度 也 是 O(logsn)。add() 函 数 也 用 于 tree[ ] 的 初始 化 过 
程 : tree[ ] 初 始 化 为 0, 然 后 用 add() 逐 一 处 理 al ,as，… ,av。 
3. 例题 


这 里 仍然 以 poj 2182 为 例 , 用 树 状 数组 实现 。 该 题 用 树 状 数组 更 容易 理解 。 
其 中 的 关键 点 如 下 : 
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(1) 在 ?个 位 置 上 ,每 个 位 置 有 一 头 牛 , 即 wa 一 az 一 … 一 ws 一 1。 不 过 ,在 程序 中 并 不 需 
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要 直接 定义 和 使 用 数组 a[]。 


(2) tree[] 数 组 的 初始 化 。 这 个 题目 比较 特殊 ,不 需要 用 add() 初 始 化 ,因为 lowbit(i) 
就 是 tree[ 门 。 

(3) 程序 所 做 的 ,就 是 对 每 个 pre[ 门 十 1, 用 findpos() 找 出 sum(z) 二 pre[ 门 十 1 所 对 应 
的 z, 就 是 第 z 头 牛 。 在 找到 第 xz 头 牛 之 后 , 令 a, 二 0, 方法 是 用 add() 更 新 数组 tree[ ], 即 


执行 add(zx，, 一 1)。 


下 面 的 程序 完全 套用 了 上 面 提 到 的 树 状 数组 的 模板 。 
poj 2182“ 树 状 数组 ” 


#include < stdio.h> 
# include < string.h> 
const int Max = 10000; 
int tree[Max], pre[Max], ans[Max]; 
int n; 
#define lowbit(x) ((x) & - (x)) 
void add(int x, int d){ 
while(x<=n) { 
tree[x] += d; 
x += lowbit(x); 
ll 
ij 
int sum( int x){ 
int sum = 0; 
while(x > 0) { 
sum += tree[x]; 
x -= lowbit(x); 
return sum; 


) 


int findpos(int x){ // 寻 找 sum(x) = pre[i] +1 所 对 应 的 x, 就 是 第 x 头 牛 


int1l= 1r= ni 
while(1 <r) { 
int mid = (1+r)>1; 
if(sum(mid) < x) 
1=mid+1; 
else 
r = Bid; 
上 
return 1; 
} 
int main(){ 
scanf("%d",gn); 
pre[1] = 0; 
for(int i=2; i<=n; i++) 
scanf(" %d",g&gpre[i]); 
for(int i=1; i<=n; i++) // 初 始 化 tree[ ] 数 组 


// 注 意 这 个 题目 比较 特殊 ,不 需要 用 add( ) 初 始 化 , 因为 lowbit(i) 就 是 tree[i] 
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tree[i] = lowbit(i); 
for(int i 二 二 和 汪 = 一 和 注 
int x findpos(pre[i] + 1); 
add(x, —1); // 更 新 tree[ ] 数 组 


ans[i] = x; 


} 

for(int i=1; i<=n; i++) 
printf(" % d\n", ans[i]); 

return 0; 


; 


4. 线段 树 和 树 状 数组 的 对 比 

两 者 的 复杂 度 同 级 ,但 是 树 状 数组 的 常数 明显 优 于 线段 树 ,编程 复杂 度 也 远 远 小 于 线 
段 树 。 

线段 树 的 适用 范围 大 于 树 状 数组 ,凡是 可 以 使 用 树 状 数组 解决 的 问题 ,使 用 线段 树 一 定 
可 以 解决 。 树 状 数组 的 优点 是 编程 非常 简洁 ,使 用 lowbit() 可 以 在 很 短 的 几 步 操作 中 完成 
核心 操作 ,代码 效率 远 远 高 于 线段 树 。 


【习题 】 


简单 题 : poj 2299/2352/1195/2481/2029 。 
中 等 题 : poj 2155/3321/1990; 

hdu 3015/2430/2852。 
难题 : poj 2464 ,uva 11610。 


5.5 小 结 


本 章 介绍 了 几 个 竞赛 中 常用 的 数据 结构 ,限于 篇 幅 , 还 有 一 些 常 用 的 数据 结构 没 讲 , 例 
如 堆 、Hash、 动 态 树 LCT 等 。 关 于 字符 串 的 数据 结构 ,在 第 9 章 中 讲解 ; 关于 图 的 数据 结 
构 ,在 第 10 章 中 讲解 。 

高 级 数据 结构 是 算法 竞赛 中 比较 难 的 内 容 ,不 仅 本 身 的 概念 难以 掌握 ,而 且 在 具体 的 题 
目 中 需要 根据 情况 灵活 修改 ,以 至 于 逻辑 复杂 、 代 码 宛 长 。 
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局 贪 心 法 

名 Huffman 编码 

司 分 治 法 

避 归 并 排序 

本 快速 排序 

局 减 治 法 

在 竞赛 中 ,队员 拿 到 一 个 题目 后 很 快 就 能 知道 这 个 题 的 考点 是 什么 ,例如 图 论 、 几 何 、 数 
学 模拟、 高 级 数据 结构 等 。 有 时 候 老 队员 还 会 说 :“ 这 一 题 的 思路 是 动态 规划 …… 后 

这 里 提 到 的 动态 规划 并 不 是 一 个 具体 的 算法 ,而 是 一 种 算法 思想 ,或 者 是 解 题 策 略 。 类 
似 地 ,把 算法 思想 分 成 一 些 大 类 了, 即 暴力 法 、 分 治 法 、 减 治 法 、 贪 心 法 ,动态 规划 。 

本 章 将 详细 介绍 贪心 法 \、 分 治 法 、 减 治 法 。 暴 力 法 已 经 在 “第 4 章 搜索 技术 ”中 介绍 , 动 
态 规划 将 在 “第 7 章 动态 规划 ”中 详细 展开 。 

对 于 算法 竞赛 初学 者 来 说 ,从 只 会 按 自然 理解 和 逻辑 做 题 , 到 能 使 用 算法 思想 分 析 和 设 
计 , 建 立 起 基本 的 计算 思维 意识 ,是 成 为 高 级 编程 者 的 重要 一 步 。 


6.1.1 基本 概念 


贪心 (Greedy) 是 最 容易 理解 的 算法 思想 : 把 整个 问题 分 解 成 多 个 步骤 ,在 每 个 步骤 都 
选取 当前 步骤 的 最 优 方 案 ,直到 所 有 步骤 结束 ; 在 每 一 步 都 不 考虑 对 后 续 步骤 的 影响 ,在 后 
续 步 骤 中 也 不 再 回头 改变 前 面 的 选择 。 简 单 地 说 ,其 思想 就 是 * 走 一 步 看 一 步 ”目光 短 浅 ”。 

贪心 法 看 起 来 似乎 不 靠 谱 , 因 为 局 部 最 优 的 组 合 不 一 定 是 全 局 最 优 的 。 那 么 ,是 否 有 一 
些 规则 使 得 局 部 最 优 能 达到 全 局 最 优 ? 本 节 将 通过 一 些 例子 来 详细 说 明 这 个 问题 。 

贪心 法 有 广泛 的 应 用 。 例 如 图 论 中 的 最 小 生成 树 算法 . 单 源 最 短路 径 算 法 Dijkstra 是 
贪心 思想 的 典型 应 用 。 关 于 这 部 分 内 容 ,请 阅读 “第 10 章 图 论 ”。 

下 面 先 用 硬币 问题 的 例子 引出 贪心 法 的 应 用 规则 。 

最 少 硬币 问题 : 某 人 带 着 3 种 面值 的 硬币 去 购物 ,有 1 元 ,2 元 、5 元 的 ,硬币 数量 不 限 ; 
他 需要 支付 M 元 , 问 怎么 支付 才能 使 硬币 数量 最 少 ? 


@ 讲解 算法 的 经 典 教材 (算法 设计 与 分 析 基 础 ) 就 是 按 这 个 分 类 展开 的 ,由 Anany Levitin 著 潘 彦 译 。 另 一 本 经 典 
教材 (算法 导论 ) 由 Thomas H. Cormen 等 著 、 潘 金贵 等 译 , 主 要 是 按 知识 点 内 容 来 展开 。 
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根据 生活 常识 ,第 一 步 应 该 先 拿 出 面值 最 大 的 5 元 硬币 ,第 二 步 拿 出 面值 第 2 大 的 2 元 
硬币 ,最 后 才 拿 出 面值 最 小 的 1 元 硬币 。 在 这 个 解决 方案 中 ,硬币 数量 总 数 是 最 少 的 。 
程序 如 下 : 


# include <bits/stdc++.h> 
using namespace std; 
const int NUM = 3; 
const int Value[NUM] = {1,2,5}; 
int main(){ 
int i, money; 
int ans[NUM] = {0}; // 记 录 每 种 硬币 的 数量 
cin >> money; // 输 入 钱 数 
for(i= NIM-1; i>=0; i--){ // 求 每 种 硬币 的 数量 
ans[i] = money/Value[i]; 
money = money — ans[i] * Value[i]; 
下 
for(i= NUM-1; i>=0; i--) 
cout << Value[ i] << "元 硬币 数 :" << ans[i] << endl; 
return 0; 


} 


在 上 面 的 例子 中 ,虽然 每 一 步 选 硬币 的 操作 并 没有 从 整体 最 优 来 考虑 ,只 在 当前 步骤 选 
取 了 局 部 最 优 ,但 结果 是 全 局 最 优 的 。 然 而 ,局 部 最 优 并 不 总 是 能 导致 全 局 最 优 。 比 如 这 个 
最 少 硬币 问题 ,用 贪心 法 一 定 能 得 到 最 优 解 吗 ? 

在 最 少 硬币 问题 中 ,如 果 稍 微 改 一 下 参数 ,就 不 一 定 能 得 到 最 优 解 , 甚 至 在 有 解 的 情况 
下 也 无 法 算出 答案 。 

(1) 不 能 得 到 最 优 解 的 情形 。 例 如 ,硬币 面值 比较 奇怪 ,是 1.2.4.5.6 元 ,支付 9 元 ,如 
果 用 贪心 法 ,答案 是 6 十 2 十 1, 需 要 3 个 硬币 ,而 最 优 的 5 十 4 只 需要 两 个 硬币 。 

(2) 算 不 出 答案 的 情形 。 例 如 ,如 果 有 面值 1 元 的 硬币 ,能 保证 用 贪心 法 得 到 一 个 解 ， 
如 果 没 有 1 元 硬币 ,常常 得 不 到 解 。 用 面值 2、3、5 元 的 硬币 ,支付 9 元 ,用 贪心 法 无 法 得 到 
解 ,但 解 是 存在 的 , 即 9 一 5 十 2 十 2。 

所 以 ,在 最 少 硬 币 问题 中 是 否 能 使 用 贪心 法 跟 硬 币 的 面值 有 关 。 如 果 是 1.2.5 这 样 的 
面值 ,贪心 法 是 有 效 的 ,而 对 于 1、2、4、5、6 或 者 2、3、5 这 样 的 面值 ,贪心 法 是 无 效 的 0。 对 
任意 面值 的 硬币 问题 ,需要 用 动态 规划 求 最 优 解 , 在 下 一 章 讲解 动态 规划 时 会 提 到 。 

虽然 贪心 法 不 一 定 能 得 到 最 优 解 ,但 是 它 思 路 简单 、 编 程 容易 。 因 此 ,如 果 一 个 问题 确 
定 用 贪心 法 能 得 到 最 优 解 ,那么 应 该 使 用 它 。 

那么 ,如 何 判 断 一 个 题目 能 用 贪心 法 ? 用 贪心 法 求解 的 问题 需要 满足 以 下 特征 : 

(1) 最 优 子 结构 性 质 。 当 一 个 问题 的 最 优 解 包含 其 子 问 题 的 最 优 解 时 , 称 此 问题 具有 
最 优 子 结构 性 质 ,也 称 此 问题 满足 最 优 性 原理 。 也 就 是 说 ,从 局 部 最 优 能 扩展 到 全 局 最 优 。 


i<i1 
四 “一 个 简单 的 判断 标准 是 ,面值 符合 之 > c; 的 硬币 , 即 任 一 面值 的 硬币 ,大 于 比 它 小 的 所 有 硬币 的 面值 之 和 ， 
i=1 
可 以 用 贪心 法 .例如 以 2 的 倍数 递增 的 1.2、4、8 等 ,这 样 的 面值 就 符合 条 件 。 
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(2) 贪心 选择 性 质 。 问 题 的 整体 最 优 解 可 以 通过 一 系列 局 部 最 优 的 选择 来 得 到 。 

贪心 算法 没有 固定 的 算法 框架 ,关键 是 如 何 选择 贪心 策略 。 贪 心 策略 必须 具备 无 后 效 
性 , 即 某 个 状态 以 后 的 过 程 不 会 影响 以 前 的 状态 ,只 与 当前 状态 有 关 。 

另外 ,对 于 某 些 难 解 问题 ,例如 旅行 商 问 题 ,很 难得 到 最 优 解 ,但 是 此 时 用 贪心 法 常常 能 
得 到 不 错 的 近似 解 。 如 果 不 一 定 非 要 求 得 最 优 解 ,那么 贪心 的 结果 也 是 很 不 错 的 方案 。 


6.1.2 常见 问题 


1. 活动 安排 问题 
活动 安排 问题 又 称 为 区 间 调 度 问题 ,原型 见 hdu 2037 题 。 


hdu 2037“ 今 年 暑假 不 AC” 
有 很 多 电视 节目 ,给 出 它们 的 起 止 时 间 , 有 的 节目 时 间 冲 突 , 问 能 完整 看 完 的 电视 
节目 最 多 有 多 少 ? 


解 题 的 关键 在 于 选择 什么 贪心 策略 才能 安排 尽量 多 的 活动 。 由 于 活动 有 开始 时 间 和 结 
束 时 间 ,考虑 下 面 3 种 贪心 策略 : 

(1) 最 早 开始 时 间 。 

(2) 最 早 结束 时 间 。 

(3) 用 时 最 少 。 

经 过 分 析 发 现 , 第 1 种 策略 是 错误 的 ,因为 如 果 一 个 活动 迟 迟 不 终止 ,后 面 的 活动 就 无 
法 开始 。 第 2 种 策略 是 合理 的 ,一 个 尽快 终止 的 活动 可 以 容纳 更 多 的 后 续 活 动 。 第 3 种 策 
略 也 是 错误 的 。 

对 最 早 结束 时 间 进 行 贪心 ,算法 步骤 如 下 : 

(1) 把 个 活动 按 结束 时 间 排 序 。 

(2) 选择 第 1 个 结束 的 活动 ,并 删除 (或 跳 过 ) 与 它 时 间 相 冲 突 的 活动 。 

(3) 重复 步骤 (2) ,直到 活动 为 空 。 每 次 选择 剩 下 的 活动 中 最 早 结束 的 那个 活动 ,并 删 
除 与 它 时 间 冲 突 的 活动 。 
下 面 的 图 6. 1 是 例子 ,最 优 活动 是 1、3、5, 活 动 2 和 活动 4 


1 mm 


rp 与 其 他 节目 有 冲突 。 
es 上 述 贪心 算法 是 否 能 保证 得 到 全 局 最 优 解 ? 
i (1) 它 符合 最 优 子 结构 性 质 。 选 中 的 第 1 个 活动 , 它 一 定 
在 某 个 最 优 解 中 ; 同 理 ,选中 的 第 2 个 活动 .第 3 个 活动 等 也 都 
在 这 个 最 优 解 中 。 
(2) 它 符合 贪心 选择 性 质 。 算 法 的 每 一 步 都 使 用 了 相同 的 贪心 策略 。 
hdu 2037 部 分 代码 
struct node { 
int start, end; // 定 义 活动 的 起 止 时 间 


} record[ MAXN]; 
bool cmp(const nodeg a, const node& b){return a.end < b.end; } 
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for(int i=0; i<n; it+) // 输 入 n 个 活动 
cin >> record[ i]. start >> record[i]. end; 
sort(record, record + n, cmp); // 按 结束 时 间 排 序 
int count = 0; 
int lastend = -1; 
for(int i=0; i<n; i++) { // 贪 心算 法 
if(record[i]. start >= lastend){ // 后 一 个 起 始 时 间 大 于 等 于 前 一 个 终止 时 间 
Count++; 
lastend = record[i].end; // 记 录 前 一 个 活动 的 终止 时 间 
| 
} 
cout << count << endl; // 输 出 活动 个 数 


2. 区 间 覆 盖 问 题 

给 定 一 个 长 度 为 n 的 区 间 , 再 给 出 m 条 线段 的 左 端点 (起 点 ) 和 右 端 点 (终点 ), 问 最 少 
用 多 少 条 线段 可 以 将 整个 区 间 完全 覆盖 ? 

贪心 思路 是 尽量 找 出 更 长 的 线段 。 其 解 题 步骤 如 下 : 

(1) 把 每 个 线段 按照 左 端点 递增 排序 。 

(2) 设 已 经 覆盖 的 区 间 是 [L,R] ,在 剩 下 的 线段 中 找 所 有 左 端点 小 于 等 于 尺 且 右 端点 
最 大 的 线段 ,把 这 个 线段 加 入 到 已 覆盖 区 间 里 ,并 更 新 已 覆盖 区 间 的 [L,R] 值 。 

(3) 重复 步骤 (2) ,直到 区 间 全 部 覆盖 。 1 一 一 

在 图 6. 2 中 ,所 有 线段 已 按 左 端点 进行 排序 。 首 先 选中 线段 2 
1 ,然后 在 2 和 3 中 选中 更 长 的 3。4 和 5 由 于 不 合 要 求 , 被 跳 过 。 4 
最 后 的 最 优 解 是 1、3。 

3. 最 优 装 载 问题 

原型 见 hdu 2570 题 。 


X 


图 6.2 区 间 覆 盖 


hdu 2570“ 迷 阅 ” 
有 nn 种 药水 ,体积 都 是 V, 浓 度 不 同 ,把 它们 混合 起 来 ,得 到 浓度 不 大 于 tw% 的 药水 ， 
问 怎么 混合 才能 得 到 最 大 体积 的 药水 ? 注意 一 种 药水 要 么 全 用 ,要 么 都 不 用 ,不 能 只 取 
一 部 分 。 


题目 要 求 配置 浓度 不 大 于 w% 的 药水 ,那么 贪心 的 思路 就 是 尽量 找 浓度 小 的 药水 。 先 
对 药水 按 浓 度 从 小 到 大 排序 ,药水 的 浓度 不 大 于 w% 就 加 入 ,如 果 药 水 的 浓度 大 于 w%, 计 
算 混 合 后 的 总 浓度 ,不 大 于 w% 就 加 入 ,否则 结束 判断 。 

4. 多 机 调度 问题 

设 有 个 独立 的 作业 ,由 m 台 相 同 的 计算 机 进行 加 工 。 作 业 i 的 处 理 时 间 为 t; ,每 个 作 
业 可 在 任何 一 台 计 算 机 上 加 工 处 理 , 但 不 能 间断 、 拆 分 。 要 求 给 出 一 种 作业 调度 方案 ,在 尽 
可 能 短 的 时 间 内 ,由 m 台 计 算 机 加 工 处 理 完成 这 个 作业 。 

求解 多 机 调度 问题 的 贪心 策略 是 最 长 处 理 时 间 的 作业 优先 , 即 把 处 理 时 间 最 长 的 作业 
分 配给 最 先 空闲 的 计算 机 。 让 处 理 时 间 长 的 作业 得 到 优先 处 理 ,从 而 在 整体 上 获得 尽 可 能 
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短 的 处 理 时 间 。 

(1) 如 果 nm, 需 要 的 时 间 就 是 个 作业 当中 最 长 的 处 理 时 间 。 

(2) 如 果 nn 二 m, 首 先 将 个 作业 按 处 理 时 间 从 大 到 小 排序 ,然后 按 顺 序 把 作业 分 配给 
空闲 的 计算 机 。 


6.1.3 Huffman 编码 


Huffman 编码 是 贪心 思想 的 典型 应 用 ,是 一 个 很 有 用 的 、 很 著名 的 算法 。Huffman 编 
码 是 “前 级 ”最 优 编码 。 

首先 了 解 什么 是 编码 。 

把 一 段 字符 串 存储 在 计算 机 中 ,这 段 字 符 串 包含 很 多 字符 ,每 种 字符 出 现 的 次 数 不 一 
样 , 有 的 频次 高 ,有 的 频次 低 。 因 为 数据 在 计算 机 中 都 是 用 二 进 制 码 来 表示 的 ,所 以 需要 把 
每 个 字符 编码 成 一 个 二 进 制 数 。 

最 简单 的 编码 方法 是 把 每 个 字符 都 用 相同 长 度 的 二 进 制 数 来 表示 。 例 如 给 出 一 段 字符 
串 , 它 只 包含 ABC.D、E 这 5 种 字符 ,编码 方案 如 表 6. 1 所 示 。 

表 6.1 简单 编码 方案 


字 符 A B C D E 
频 次 3 9 6 15 19 
编 码 000 001 010 011 100 


每 个 字符 用 3 位 二 进 制 数 表示 ,存储 的 总 长 度 是 3X (3 十 9 十 6 十 15 十 19) 一 156 。 
这 种 编码 方法 简单 、 实 用 ,但 是 不 节省 空间 。 由 于 每 个 字符 出 现 的 频次 不 同 ,可 以 想到 
用 变 长 编码 : 出 现 次 数 多 的 字符 用 短 码 表示 ,出现 少 的 用 长 码 表示 ,例如 表 6. 2。 


表 6.2 变 长 编码 方案 


字 符 A B C D E 
频 次 3 9 6 15 19 
编 码 1100 111 1101 10 0 


存储 的 总 长 度 是 3X4 十 9X3 十 6X4 十 15X2 十 19X1=112。 

第 2 种 方法 相当 于 第 1 种 方法 进行 了 压缩 ,压缩 比 是 156/112 一 1. 39。 

当然 ,编码 算法 的 基本 要 求 是 编码 后 得 到 的 二 进 制 串 能 唯一 地 进行 解码 还 原 。 上 面 第 
1 种 方法 是 正确 的 ,每 3 位 二 进 制 数 对 应 一 个 字符 。 第 2 种 方法 也 是 正确 的 ,例如 
“11001111001101”, 解 码 后 唯一 得 到 “ABDEC”。 

如 果 胡 乱 设 定编 码 方案 ,很 可 能 是 错误 的 ,例如 表 6. 3。 


表 6.3 错误 编码 方案 


字 符 A B 本 D E 
频 次 3 9 6 15 19 
编 码 100 10 起 1 0 
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看 起 来 似乎 每 个 字符 都 有 不 同 的 编码 ,编码 后 的 总 长 度 也 更 短 , 只 有 3X3 十 9X2 十 
6X2 十 15X1 十 19X1=73。 但 是 编码 无 法 解码 还 原 ,例如 "100", 是 "A"、"BE" 还 是 
"DEE" 呢 ? 

错误 的 原因 是 , 某 个 编码 是 另 一 个 编码 的 前 缀 (prefix), 即 这 两 个 编码 有 包含 关系 , 导 
致 了 混淆。 

那么 有 没有 比 第 2 种 编码 方法 更 好 的 方法 ?这 引出 了 一 个 字符 串 存储 的 常见 问题 : 给 
定 一 个 字符 串 ,如 何 编码 ,能 使 编码 后 的 总 长 度 最 小 ? 即 如 何 得 到 一 个 最 优 解 ? 

作为 后 续 讲解 的 预习 ,读者 可 以 验证 : 第 2 种 编码 方法 已 经 达到 了 最 优 ,编码 后 的 总 长 
度 112 就 是 能 得 到 的 最 小 长 度 。 

下 面 介 绍 Huffman 编码 。Huffman 编码 是 前 级 编 
码 算 法 中 的 最 优 算法 。 

首先 考虑 如 何 进行 编码 ?由 于 编码 是 二 进 制 ,容易 
想到 用 二 又 树 来 构造 编码 。 

例如 上 面 第 2 种 编码 方案 ,其 二 又 树 如 图 6.3 
所 示 。 

在 每 个 二 叉 树 的 分 支 ,左边 是 0 ,右边 是 1。 二 叉 树 
末端 的 叶子 是 编码 ,把 编码 放 在 叶子 上 ,可 以 保证 符合 
前 级 不 包含 的 要 求 。 出 现 频次 最 高 的 字符 E, 在 最 靠近 。 图 6.3 用 二 又 树 实现 前 级 编码 
根 的 位 置 , 编 码 最 短 ; 出 现 频次 最 低 的 字符 A ,在 二 叉 树 最 深 处 ,编码 最 长 。 

这 棵 编码 二 又 树 是 如 何 构造 的 ? 是 最 优 的 吗 ? 

Huffman 编码 是 利用 贪心 思想 构造 二 叉 编码 树 的 算法 。 

首先 对 所 有 字符 按 出 现 频次 排序 ,如 表 6.4 所 示 。 


表 6.4 对 字符 按 出 现 频次 排序 


字 符 A C B D E 
频 次 3 6 9 15 19 


然后 从 出 现 频次 最 少 的 字符 开始 ,用 贪心 思想 安排 在 二 又 树 上 。 其 步骤 如 图 6.4 所 示 。 

每 个 结 点 圆圈 内 的 数字 是 这 个 子 树 下 字符 出 现 的 频次 之 和 。 

贪心 的 过 程 是 按 出 现 频次 从 底层 往 顶 层 生 成 二 又 树 。 注 意 ,每 一 步 都 要 按 频 次 重新 排 
序 , 例 如 图 6.4(c) 和 (d) 中 调整 了 D 和 下 的 顺序 。 这 个 过 程 可 以 保证 出 现 频次 少 的 字符 被 
放 在 树 的 底层 ,编码 更 长 ; 出 现 多 的 字符 被 放 在 上 层 ,编码 更 短 。 

可 以 证 明 ,Huffman 算法 符合 贪心 法 的 “最 优 子 结构 性 质 ”" 和 “贪心 选择 性 质 *?。 编 码 
的 结果 是 最 优 的 。 


外 证 明 见 (算法 导论 ),Thomas H. Cormen 等 著 , 潘 金贵 等 译 , 机 械 工业 出 版 社 ,234 页 ,“ 赫 夫 曼 算法 的 正确 性 ”。 
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OOOO © 
A 4 B D E 0, 1 B 
© © 
A C 
人 字符 排序 (6) 把 A 、C 放 到 二 又 树 上 


E 


(0) 把 B 放 到 二 叉 树 上 ， 调 整 D (d) 把 D 放 到 二 叉 权 上， 调整 E (e) 结果 
图 6.4 Huffman 编码 算法 的 步骤 
下 面 给 出 一 个 例题 。 


poj 1521 “Entropy” 
输入 一 个 字符 串 ,分别 用 普通 ASCII 编码 (每 个 字符 8bit) 和 Huffman 编码 ,输出 编 
码 后 的 长 度 , 并 输出 压缩 比 。 
输入 样 例 ; 
AAAAABCD 
输出 样 例 : 
64 13 4.9 


这 一 题 正常 的 解 题 过 程 是 首先 统计 字符 出 现 的 频次 ,然后 用 Huffman 算法 编码 ,最 后 
计算 编码 后 的 总 长 度 。 不 过 ,由 于 只 需要 输出 编码 的 总 长 度 ,而 不 要 求 输出 每 个 字符 的 编 
码 , 所 以 可 以 跳 过 编码 过 程 ,利用 图 6. 4 描述 的 Huffman 编码 思想 (圆圈 内 的 数字 是 出 现 频 
次 ) ,直接 计算 编码 的 总 长 度 。 

下 面 的 代码 使 用 了 STL 的 优先 队列 ,在 每 个 贪心 步骤 ,从 优先 队列 中 提取 频次 最 低 的 
两 个 字符 。 

poj 1521 部 分 代码 


string s; 
priority queue < int, vector < int >, greater < int >> 0; 
// 优 先 队列 ,最 小 的 在 队 首 
while(getline(cin, s) && s != "END"){ // 输 入 字符 串 
El 


sort(s.begin(), s.end()); 
for(int i=1;i<s.length();it+){ ”// 统 计 字 符 出 现 的 频次 ,并 放 进 优先 队列 
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if(s[i] = s[i-1]){ 
Q.push(t); 
t= 六 
} 
else t++; 
} 
Q.push(t); 
int ans = 0; 
while(Q. size() > 1){ 
int a = Q.top(); Q.pop(); // 提 取 队 列 中 最 小 的 两 个 
int b = Q. top(); Q.pop(); 
Q. push(a+b); 
ans += a+Db; // 直 接 计算 编码 的 总 长 度 , 请 思考 为 什么 
} 
Q. pop(); 
. 
//ans 就 是 编码 后 的 总 长 度 


6.1.4 模拟 退火 


模拟 退火 算法 基于 这 样 一 个 物理 原理 : 一 个 高 温 物 体 降 温 到 常温 ,温度 越 高 时 降温 的 
概率 越 大 (降温 更 快 ) ,温度 越 低 时 降温 的 概率 越 小 (降温 更 慢 )。 模 拟 退 火 算法 利用 这 样 一 
种 思想 进行 搜索 , 即 进行 多 次 降温 (迭代 ) ,直到 获得 一 个 可 行 解 。 

在 迭代 过 程 中 ,模拟 退火 算法 随机 选择 下 一 个 状态 ,有 两 种 可 能 : 新 状态 比 原状 态 更 
优 ,那么 接受 这 个 新 状态 ; 四 新 状态 更 差 ,那么 以 一 定 的 概率 接受 该 状态 ,不 过 这 个 概率 应 
该 随 着 时 间 的 推移 逐渐 降低 。 

模拟 退火 算法 是 贪心 思想 和 概率 的 结合 ,常用 * 疏 山 "问题 来 介绍 贪心 有 关 的 算法 ,在 
图 6.5 中 ,A 是 局 部 最 高 点 ,B 是 全 局 最 高 点 。 普 通 的 贪心 算法 ,如 果 当 前 状态 在 A 附近 ， 
会 一 直 仆 山 , 最 后 停滞 在 局 部 最 高 点 A ,而 无 法 到 达 B。 模 拟 


退火 算法 能 跳出 A, 得 到 B。 因 为 它 不 仅 往 上 扑 山 ,而 且 以 一 “ 
定 的 概率 接受 比 当 前 点 更 低 的 点 ,使 程序 有 机 会 摆脱 局 部 最 

优 到 达 全 局 最 优 。 这 个 概率 会 随时 间 不 断 减 小 ,从 而 最 后 能 

限制 在 最 优 解 附近 。 图 6.5 模拟 退火 与 贪心 


模拟 退火 算法 的 主要 步骤 如 下 : 
(1) 设置 一 个 初始 的 温度 工 。 
(2) 温度 下 降 , 状 态 转移 。 从 当前 温度 按 降温 系数 下 降 到 下 一 个 温度 ,在 新 的 温度 计算 


当前 状态 。 
(3) 如 果 温 度 降 到 设 定 的 温度 下 界 ,程序 停止 。 
伪 代 码 如 下 : 
eps = le—8; // 终 止 温度 ,接近 0, 用 于 控制 精度 
= 100; // 初 始 温度 ,应 该 是 高 温 , 以 100Y 为 例 
delta = 0.98; // 降 温 系 数 ,控制 退火 的 快慢 ,小 于 1, 以 0.98 为 例 
g(x); // 状 态 x 时 的 评价 函数 ,例如 物理 意义 上 的 能 量 


”105“ 


算法 竞赛 入 门 到 进 阶 


now, next; // 当 前 状态 和 新 状态 
while(T > eps){ // 如 果 温 度 未 降 到 eps 
g(next), g(now); // 计 算 能 量 
dE= g(next) — g(now); // 能 量 差 
if(dE >=0) // 新 状态 更 优 ,接受 新 状态 


now = next; 
else if(exp(dE/T)> rand()) // 如 果 新 状态 更 差 ,在 一 定 概率 下 接受 它 ,e “(dE/T) 
now = next; 
T*#*= delta; // 降 温 , 模 拟 退 火 过 程 
} 


模拟 退火 在 算法 竞赛 中 的 典型 应 用 有 函数 最 值 问题 TSP 旅行 商 问题 .最 小 圆 覆 盖 、 
小 球 覆盖 等 。 在 本 书 第 11. 2. 2 节 中 给 出 了 用 模拟 退火 求解 最 小 圆 覆 盖 的 例子 。 下 面 的 例 
子 是 求 函 数 最 值 。 


hdu 2899 “Strange function” 
函数 F(x) 二 6x' 十 8X' 十 7T? 十 5x? 一 yx, 其 中 之 的 范围 是 0 志 x 志 100。 
输入 y 值 ,输出 下 (zx) 的 最 小 值 。 


用 模拟 退火 求 函数 最 值 是 最 合适 的 。 下 面 是 代码 : 


# include < bits/stdc++.h> 
using namespace std; 


const double eps = le- 8; // 终 止 温度 
double y; 
double func(double x){ // 计 算 函 数值 


return 6 * pow(x,7.0) +8*pow(x,6.0) +7*x pow(x,3.0) +5* pow(x,2.0)— yx x; 
|; 
double solve(){ 


double T = 100; // 初 始 温度 
double delta = 0.98; // 降 温 系数 
doublex = 50.0; //x 的 初始 值 
double now = func(x); // 计 算 初始 函数 值 
double ans = now; // 返 回 值 
while(T > eps){ //eps 是 终止 温度 
int f[2] = {1, -1}; 
double newx = x+f[rand()%2]*T; // 按 概率 改变 x, 随 了 的 降温 而 减少 


if(newx >=0 && newx <= 100){ 
double next = func(newx); 
ans = min(ans,next); 
if(now — next > eps){x = newx; now = next;} // 更 新 x 

} 

T*= delta; 

} 
return ans; 
} 
int main(){ 
int cas; scanf("%d",&cas); 
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while(cas —— ){ 
scanf(" % 1f",&y); 
printf(" % .4f\n", solve()); 


上 


模拟 退火 算法 用 起 来 非常 简单 .方便 ,不 过 也 有 缺点 。 它 得 到 的 是 一 个 可 行 解 ,而 不 是 
精确 解 。 例 如 上 面 的 例题 ,计算 到 4 位 小 数 点 的 精度 就 停止 ,实际 上 是 一 个 可 行 解 , 所 以 算 
法 的 效率 和 要 求 的 精度 有 关 。 在 一 般 情况 下 ,模拟 退火 算法 的 复杂 度 会 比 其 他 精确 算法 差 。 
用 户 在 应 用 时 需要 仔细 选择 初始 温度 本 .降温 系数 delta\ 终 止 温度 eps 等 。 


6.1.5 习题 


hdu 1789“Doing Homework again” ,活动 安排 问题 。 

hdu 1050“Moving Tables”, 空 间 问题 ,模型 和 活动 安排 问题 一 样 。 

hdu 2546“ 饭 卡 ”, 普 通 背 包 问题 。 

hdu 3348“coins”, 钱 币 问题 。 

hdu 4864“task”, 不 错 的 题 。 

poj 1328“Radar Installation”, 几 何 问题 , 建 模 为 活动 安排 问题 。 

poj 1089“Intervals”, 区 间 覆 盖 问 题 ,给 定 很 多 线段 ,合并 线段 ,使 得 合并 后 间隔 最 小 。 


6.2 分 治 法 


分 治 法 是 广为人知 的 算法 思想 ,很 容易 理解 。 人 们 在 遇 到 一 个 难以 直接 解决 的 大 问题 
时 ,自然 会 想到 把 它 划 分 成 一 些 规模 较 小 的 子 问题 ,各 个 击破 ,“ 分 而 治之 (Divide and 
Conquer)”。 

在 软件 开发 项 目的 详细 设计 阶段 ,常常 会 开 一 个 “头脑 风暴 "会议 ,把 整个 项 目 分 解 成 相 
对 独立 的 子 问题 ,其 思想 符合 分 治 法 。 

分 治 算法 的 具体 操作 是 把 原 问 题 分 成 & 个 较 小 规模 的 子 问题 ,对 这 个 子 问 题 分 别 求 
解 。 如 果子 问题 不 够 小 ,那么 把 每 个 子 问题 再 划分 为 规模 更 小 的 子 问 题 。 这 样 一 直 分 解 下 
去 ,直到 问题 足够 小 ,很 容易 求 出 这 些小 问题 的 解 为 止 。 

能 用 分 治 法 的 题目 需要 符合 以 下 两 个 特征 。 

(1) 平衡 子 问题 : 子 问题 的 规模 大 致 相同 ,能 把 问题 划分 成 大 小 差不多 相等 的 & 个 子 问 
题 ,最 好 & 一 2, 即 分 成 两 个 规模 相等 的 子 问题 。 子 问题 规模 相等 的 处 理 效率 比 子 问题 规模 
不 等 的 处 理 效率 要 高 。 

(2) 独立 子 问题 : 子 问 题 之 间 相 互 独立 。 这 是 区 别 于 动态 规划 算法 的 根本 特征 ,在 动 
态 规划 算法 中 , 子 问题 是 相互 联系 的 ,而 不 是 相互 独立 的 。 

特别 需要 说 明 的 是 ,分 治 法 不 仅 能 够 让 问题 变 得 更 容易 理解 和 解决 ,而 且 能 大 大 优化 算 
法 的 复杂 度 ,在 一 般 情况 下 能 把 O(n) 的 复杂 度 优化 到 O(logsn)。 这 是 因为 ,局 部 的 优化 有 
利于 全 局 ; 一 个 子 问题 的 解决 ,其 影响 力 扩 大 了 kk 信 . 即 扩大 到 了 全 局 。 
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举 一 个 简单 的 例子 : 在 一 个 有 序 的 数列 中 查找 一 个 数 。 简 单 的 办 法 是 从 头 找到 尾 , 复 
杂 度 是 O(n)。 如 果 用 分 治 法 , 即 “ 折 半 查 找 ”, 则 最 多 只 需要 logzn 次 就 能 找到 。 

分 治 法 是 一 种 “并 行 " 算 法 。 由 于 子 问题 是 相互 独立 的 ,因此 可 以 把 子 问 题 分 给 不 同 的 
计算 机 ,分 开 单 独 解决 。 

分 治 法 如 何 编程 ? 分 治 法 的 思想 几乎 就 是 递归 的 过 程 , 用 递归 程序 实现 分 治 法 是 很 自 
然 的 。 

在 用 分 治 法 建立 模型 时 , 解 题 步骤 分 为 以 下 3 步 。 

(1) 分 解 (Divide) : 把 问题 分 解 成 独立 的 子 问题 。 

(2) 解决 (Conquer) : 递归 解决 子 问题 。 

(3) 合并 (Combine) : 把 子 问 题 的 结果 合并 成 原 问 题 的 解 。 

分 治 法 的 经 典 应 用 有 汉 诺 塔 ,快速 排序 .归并 排序 等 。 


6.2.1 归并 排序 


归并 排序 和 快速 排序 都 是 非常 精美 的 算法 ,学 习 它 们 ,对 于 理解 分 治 法 思想 、 提 高 算法 
思维 能 力 十 分 有 帮助 。 在 学 习 归 并 排序 和 快速 排序 之 前 ,请 读者 先 学 习 交 换 排 序 、 选 择 排 
序 \ 冒 泡 排序 等 暴力 的 排序 方法 ?。 

在 介绍 归并 排序 和 快速 排序 之 前 先 思考 一 个 问题 如 何 用 分 治 思 想 设计 排序 算法 ? 

根据 分 治 法 的 分 解 、. 解 决 、 合 并 三 步骤 ,具体 思路 如 下 : 

(1) 分 解 。 把 原来 无 序 的 数列 分 成 两 部 分 ,对 每 个 部 分 ,再 继续 分 解 成 更 小 的 两 部 
他 在 归并 排序 中 ,只 是 简单 地 把 数列 分 成 两 半 。 在 快速 排序 中 ,是 把 序列 分 成 左右 两 
部 分 , 左 部 分 的 元 素 都 小 于 右 部 分 的 元 素 。 分 解 操作 是 快速 排序 的 核心 操作 。 

(2) 解决 。 分 解 到 最 后 不 能 再 分 解 ,排序 。 

(3) 合并 。 把 每 次 分 开 的 两 个 部 分 合并 到 一 起 。 归 并 排序 的 核心 操作 是 合并 ,其 过 程 
类 似 于 交换 排序 。 快 速 排序 并 不 需要 合并 操作 ,因为 在 分 解 过 程 中 左 、 右 部 分 已 经 是 有 
序 的 。 

本 节 先 讲解 归并 排序 ,然后 讲解 归并 排序 的 典型 应 用 一 一 逆序 对 ”问题 。 

1. 归并 排序 示例 

下 面 的 例子 给 出 了 归并 排序 的 操作 步 又。 初始 数列 经 过 3 趟 归并 之 后 得 到 一 个 从 小 到 
大 的 有 序数 列 , 如 图 6. 6 所 示 。 请 读者 根据 这 个 例子 分 析 它 是 如 何 实现 分 治 法 的 分 解 、 解 
决 、 合 并 3 个 步骤 的 。 

分 析 该 图 ,归并 排序 的 主要 操作 如 下 : 

(1) 分 解 。 把 初始 序列 分 成 长 度 相 同 的 左 、 右 两 个 子 序列 ,然后 把 每 个 子 序列 再 分 成 更 
小 的 两 个 子 序列 ,直到 子 序 列 只 包含 1 个 数 。 这 个 过 程 用 递归 实现 ,图 6.6 中 的 第 1 行 是 初 
始 序 列 , 每 个 数 是 一 个 子 序列 ,可 以 看 成 递归 到 达 的 最 底层 。 

(2) 求解 子 问 题 ,对 子 序 列 排序 。 最 底层 的 子 序列 只 包含 1 个 数 ,其 实 不 用 排序 。 


@ 算法 竞赛 中 的 排序 ,最 多 只 处 理 千 万 级 的 数据 量 , 即 可 以 一 次 在 内 存 中 处 理 。 工 程 上 可 能 需要 对 大 数据 排序 ， 
例如 1TB 的 数据 ,数据 量 太 大 ,单个 的 CPU 一 次 只 能 处 理 一 小 部 分 ,所 以 不 能 简单 地 用 某 个 排序 算法 。 在 找 工 作 面 试 
时 ,常常 出 现 这 种 大 数据 排序 的 题目 ,读者 可 以 学 习 有 关 的 知识 。 
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初始 序列 [13] B41 sol BY ey, hel, ‘164) 
了 v 


第 1 趟 归并 [13 | 94] [34 | [076 89] [64] 


7 于 
第 2 趟 归并 [13 44 56 94] [64 76 89] 
和 


第 3 趟 归并 [3 44 56 94 64 76 89] 
图 6.6 归并 排序 
(3) 合并 。 归 并 两 个 有 序 的 子 序列 ,这 是 归并 排序 的 主要 操作 ,过 程 如 图 6 


.7 所 示 。 例 


如 在 图 6.7(a) 中 ,i 和 j 分 别 指向 子 序 列 {13,94,99} 和 {34,56) 的 第 1 个 数 ,进行 第 1 次 比 
较 ,发 现 a[ 门 <a[ 站 ,把 a[ 门 放 到 临时 空间 5[] 中 。 总 共 经 过 4 次 比较 ,得 到 了 6b[]={13， 


34,56,94,99}。 


a0: [13 94 99] [34 56] all:[13 94 99] [34 56] 
约 1 + t 
0 广 3 | 户 3 
20: [13 ] 20: 3 34 ] 
(a) 第 1 次 比较 (b) 第 2 次 比较 
all: [13 94 99] [34 56] a0: [3 94 99] [34 56] 
jn 点 二 1 户 
b0: [13 34 56 ] b[]:[13 34 56 94 99] 
(©) 第 3 次 比较 (d) 第 4 次 比较 


6.7 归并 排序 的 一 次 合并 


在 暴力 排序 算法 中 ,有 一 种 算法 是 交换 排序 ,归并 排序 可 以 看 成 是 交换 排序 的 升级 版 。 


交换 排序 的 步骤 如 下 : 
(1) 第 1 轮 , 检 查 第 1 个 数 w 。 把 序列 中 后 面 所 有 的 数 一 个 一 个 跟 它 比较 
一 个 比 w 小 ,就 交换 。 第 1 轮 结束 后 ,最 小 的 数 就 排 在 了 第 1 个 位 置 。 


,如 果 发 现 有 


(2) 第 2 轮 , 检 查 第 2 个 数 。 第 2 轮 结束 后 ,第 2 小 的 数 排 在 了 第 2 个 位 置 。 


(3) 继续 上 述 过 程 ,直到 检查 完 最 后 一 个 数 。 

交换 排序 的 复杂 度 是 O(n?)。 

在 归并 排序 中 ,一 次 合并 的 操作 和 交换 排序 很 相似 ,只 是 合并 的 操作 是 基 了 
子 序列 ,效率 更 高 。 


F 两 个 有 序 的 


下 面 分 析 归 并 排序 的 计算 复杂 度 。 对 n 个 数 进行 归并 排序 : 四 需要 logsn 趟 归并 ; 
@ 在 每 一 趟 归并 中 有 很 多 次 合并 操作 ,一 共 需 要 O(n) 次 比较 。 所 以 计算 复杂 度 是 


O(nlogsn)。 
空间 复杂 度 : 由 于 需要 一 个 临时 的 bL] 存 储 结果 ,所 以 空间 复杂 度 是 O(n) 


读者 从 归并 排序 的 例子 可 以 体会 到 ,对 于 整体 上 O(n) 复 杂 度 的 问题 ,通过 分 治 可 以 减 


少 为 O(logz?) 复 杂 度 的 问题 。 
2. 逆序 对 问题 


排序 是 竞赛 中 的 常用 功能 ,一 般 直 接 使 用 STL 的 sort() 函 数 , 并 不 需要 自己 青 写 一 个 
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排序 的 程序 。 不 过 也 有 一 些 特殊 的 问题 ,需要 写 出 程序 ,并 在 程序 内 部 做 一 些 处 理 , 例 如 逆 
序 对 问题 。 


hdu 4911 “Inversion” 

输入 一 个 序列 {a1,as，…,as) ,交换 任意 两 个 相 邻 元 素 ,不 超过 尺 次 。 在 交换 之 后 ， 
问 最 少 的 逆序 对 有 多 少 个 ? 

序列 中 的 一 个 逆序 对 是 指 存在 两 个 数 ui 和 aj, 有 ai 之 a; 且 1 三 i<j 二 n。 也 就 是 说 ， 
大 的 数 排 在 小 的 数 前 面 。 

输入 : 第 1 行 是 n 和 上 ,1 三 n 二 105 ,0 二 k 志 10，; 第 2 行 包括 个 整数 {a azyas，…， 
an} ,0 委 w 委 10? 。 

输出 : 最 少 的 逆序 对 数量 。 

输入 样 例 : 

31 

| 

输出 样 例 : 

1 


当 k 二 0 时 ,就 是 求 原始 序列 中 有 多 少 个 逆序 对 。 

求 &=0 时 的 逆序 对 ,用 暴力 法 很 容易 : 先 检查 第 1 个 数 w ,把 后 面 的 所 有 数 跟 它 比 较 ， 
如 果 发 现 有 一 个 比 a 小 ,就 是 一 个 逆序 对 ; 再 检查 第 2 个 数 ,第 3 个 数 …… 直到 最 后 一 个 
数 。 其 复杂 度 是 0(0z2 ) 。 本 题 中 交 最 大 是 105 ,所 以 暴力 法 会 TLE。 

考察 暴力 法 的 过 程 ,会 发 现 和 交换 排序 很 像 。 那 么 自然 可 以 想到 ,能 否 用 交换 排序 的 升 
级 版 一 一 归并 排序 来 处 理 逆序 对 问题 ? 

观察 图 6.7 所 示 的 一 次 合并 过 程 发 现 , 可 以 利用 这 个 过 程 记录 逆序 对 。 观 察 到 以 下 
现象 : 
(1) 在 子 序列 内 部 ,元 素 都 是 有 序 的 ,不 存在 逆序 对 ; 逆序 对 只 存在 于 不 同 的 子 序列 
之 间 。 

(2) 在 合并 两 个 子 序列 时 ,如 果 前 一 个 子 序列 的 元 素 比 后 面子 序列 的 元 素 小 ,那么 不 产 
生 逆序 对 ,如 图 6.7(a) 所 示 ; 如 果 前 一 个 子 序列 的 元 素 比 后 面子 序列 的 元 素 大 ,就 会 产生 逆 
序 对 ,如 图 6.7(b) 所 示 。 不 过 ,在 一 次 合并 中 ,产生 的 北 序 对 不 止 一 个 ,例如 在 图 6.7(b) 中 
把 34 放 到 6[] 中 时 , 它 与 94、99 产生 了 两 个 逆序 对 。 在 下 面 的 程序 中 ,相关 代码 是 “cnt 十 一 
mid 一 i 十 1;”。 

根据 以 上 观察 ,只 要 在 归并 排序 过 程 中 记录 逆序 对 就 行 了 。 

以 上 解决 了 k==0 时 原始 序列 中 有 多 少 个 逆序 对 的 问题 ,现在 考虑 , 当 k 隆 0 时 ( 即 把 序 
列 中 任意 两 个 相 邻 数 交换 不 超过 次) 逆序 对 最 少 有 多 少 ? 注意 ,不 超过 次 的 意思 是 可 以 
少 于 次 ,而 不 是 一 定 要 此 次 。 

在 所 有 相 邻 数 中 ,只 有 交换 那些 逆序 的 才 会 影响 逆序 对 的 数量 。 设 原始 序列 有 cnt 个 
逆序 对 ,讨论 以 下 两 种 情况 : 

(1) 如 果 cnt<&, 总 逆序 数量 不 够 交换 & 次 。 所 以 进行 & 次 交换 之 后 ,最 少 的 逆序 对 数 
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量 为 0。 
(2) 如 果 cnt 二 ,让 次 交换 都 发 生 在 逆序 的 相 邻 数 上 ,那么 剩余 的 逆序 对 是 cnt 一 &。 
求 逆序 对 的 程序 几乎 可 以 完全 套用 归并 排序 的 模板 ,差不多 就 是 归并 排序 的 裸 题 。 在 
下 面 的 程序 中 ,Mergesort() 和 Merge() 是 归并 排序 。 与 纯 归 并 排序 的 程序 相 比 , 它 只 多 了 
一 名 “cnt 十 二 mid 一 i 十 1;”。 
hdu 4911 归并 排序 ( 求 逆序 对 ) 


#include <bits/stdc++.h> 
const int MAXN = 100005; 
typedef long long 11; 
11 a[ MAXN], b[MAXN], cnt; 
void Merge(11 1，11 mid, 11 r){ 
11i=1,j= midt+1, t=0; 
while(i <=mid && j <=r){ 
if(a[i] > alj]){ 
b[tf+] = a[j++]， 
cnt += mid—-i+1; // 记 录 逆 序 对 数量 
} 


else b[t++] =a[it+]; 


L 

// 一 个 子 序列 中 的 数 都 处 理 完了 , 另 一 个 还 没有 ,把 剩 下 的 直接 复制 过 来 
while(i <=mid) b[t++] =a[i++]; 
while(j <=r) b[t++]=a[j++]; 


for(i=0; i<t; if+) a[ll+i] = b[i]; // 把 排 好 序 的 b[ ] 复 制 回 a[ ] 
} 
void Mergesort(11 1, 11 r){ 
if(1<r){ 
11 mid = (1+r)/2; // 平 分 成 两 个 子 序列 


Mergesort(1, mid); 
Mergesort(mid+1, r); 
Merge(1, mid, r); // 合 并 
| 
} 


int main(){ 


2 

while(scanf("% lld% 1ld", g&n, &k) != EOF){ 
cnt = 0; 
for(ll i=0;i<n;it++) scanf("%1ld", &a[i]); 
Mergesort(0,n— 1); // 归 并 排序 
if(cnt <=k) printf("0\n"); 
else printf(" % I64d\n", cnt — k); 

} 

return 0; 


上 


道 序 对 问题 ,除了 可 以 用 归并 排序 求解 以 外 ,也 可 以 用 树 状 数组 求解 。 
6.2.2 快速 排序 


快速 排序 的 思路 是 : 把 序列 分 成 左右 两 部 分 ,使 得 左边 所 有 的 数 都 比 右边 的 数 小 ; 递 
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归 这 个 过 程 , 直 到 不 能 再 分 为 止 。 

那么 如 何 把 序列 分 成 左 、 右 两 部 分 ? 最 简单 的 办 法 是 设 定 两 个 临时 空间 XY 和 一 个 基 
准 数 t+; 检查 序列 中 所 有 的 元 素 , 比 上 小 的 放 在 X 中 , 比 t 大 的 放 在 Y 中 。 其 实 不 用 这 么 麻 
烦 , 直 接 在 原 序列 上 操作 就 行 了 ,不 需要 使 用 临时 空间 X、Y。 

直接 在 原 序列 上 进行 划分 的 方法 也 有 很 多 种 ,下 面 的 例子 介绍 了 一 种 很 容易 操作 的 
方法 : 


512|8| 3|4 | 尾部 的 t 是 基准 数 ,i 指向 比 t 小 的 左 部 分 ,j 指向 比 上 大 的 右 部 分 。 


5|2|8|3|4 | 车 data[j] 宇 data[t],j 十 十 。 


2 15|8|3|4 | 车 data[ 站 二 data[t], 交 换 data[j] 和 data[ 门 ,然后 i 十 十 ,j 十 十 。 


213|8|5|4 | 继续 。 


车 
213|4|5|8| 最 后 ,交换 dataLi 和 data[t]j, 得 到 结果 。i 指向 基准 数 的 当前 
位 置 。 
下 面 用 上 述 方法 实现 快速 排序 。 


快速 排序 程序 (poj 2388) 


# include "stdio. h" 

const int N = 10010; 

int data[ N]; 

#define swap(a, b) {int temp = a;a = b; b = temp;} // 交 换 


int partition( int left, int right){ // 划 分 成 左 、 右 两 部 分 ,以 i 指向 的 数 为 界 
int i = left; 
int temp = data[right]; // 把 尾部 的 数 看 成 基准 数 


for(int j = left; j < right; j++) 
if(data[j] < temp){ 
swap(data[ j], data[i]); 
Eh? 
于 
swap(data[ i], data[right]); 
return i; // 返 回 基准 数 的 位 置 
void quicksort(int left, int right){ 
if(left < right){ 


int i = partition(left, right); // 划 分 
quicksort(left, i—1); // 分 治 :i 左边 的 继续 递归 划分 
quicksort(i+1, right); // 分 治 :i 右边 的 继续 递归 划分 
} 
} 
int main(){ 
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int n; 

scanf("%d", gn); 

for(int i=1; i<=n; i++) scanf("%d", gdata[i]); 
quicksort(1, n); 

printf(" % d\n", data[ (n+1)/2]); 

return 0; 


. 


下 面 分 析 复 杂 度 。 

每 一 次 划分 ,都 把 序列 分 成 了 左 、 右 两 部 分 ,在 这 个 过 程 中 ,需要 比较 所 有 的 元 素 , 有 
OG0D) 次 。 如 果 每 次 划分 是 对 称 的 ,也 就 是 说 左 、 右 两 部 分 的 长 度 差 不 多 ,那么 一 共 需 要 划分 
O(logzn) 次 。 其 总 复杂 度 是 O(nlogzn)。 

如 果 划 分 不 是 对 称 的 , 左 部 分 和 右 部 分 的 数量 差别 很 大 ,那么 复杂 度 会 高 一 些 。 在 极端 
情况 下 ,例如 左 部 分 只 有 一 个 数 , 剩 下 的 全 部 都 在 右 部 分 ,那么 最 多 可 能 划分 次 ,总 复杂 度 
是 O(0z2)。 所 以 ,快速 排序 是 不 稳定 的 。 ok 

不 过 ,一 般 情况 下 快速 排序 效率 很 高 ,甚至 比 稳定 的 归并 排序 更 好 。 读 者 
可 以 观察 到 ,快速 排序 的 代码 比 归并 排序 的 代码 简洁 ,代码 中 的 比较 、 交 换 、 复 堪 
制 操作 很 少 。 快 速 排序 几乎 是 目前 所 有 排序 法 中 速度 最 快 的 方法 。STL 的 ” 回 
sort() 函数 就 是 基于 快速 排序 算法 的 ,并 针对 快速 排序 的 缺点 做 了 很 多 优化 。 视频 讲解 

快速 排序 思想 可 以 用 来 解决 一 些 特殊 问题 ,例如 求 第 大 数 问 题 。 

求 第 & 大 的 数 ,简单 的 方法 是 用 排序 算法 进行 排序 ,然后 定位 第 & 大 的 数 ,其 复杂 度 是 
O(nlog2zn)。 

如 果 用 快速 排序 的 思想 ,可 以 在 O(n) 的 时 间 内 找到 第 大 的 数 了 。 在 快速 排序 程序 
中 ,每 次 划分 的 时 候 只 要 递归 包含 第 个 数 的 那 部 分 就 行 了 。 


【习题 】 


hdu 1425, 求 前 & 大 的 数 ; 
poj 2388, 求 中 间 数 。 


6.3 减 治 法 


大 多 数 算法 书籍 不 会 特别 讲解 减 治 法 (Decrease and Conquer) , 减 治 法 的 题目 常常 被 归 
纳 到 其 他 算法 思想 中 。 

用 减 治 法 解 题 的 过 程 是 把 原 问 题 分 解 为 小 问题 ,再 把 小 问题 分 解 为 更 小 的 问题 ,直到 得 
到 解 。 规 模 为 n 的 原 问 题 与 分 解 后 较 小 规模 的 子 问题 ,它们 的 解 有 以 下 关系 : 

(1) 原 问题 的 解 只 存在 于 其 中 一 个 子 问题 中 ; 

(2) 原 问题 的 解 和 其 中 一 个 子 问题 的 解 之 间 存 在 某 种 对 应 关系 。 


@ 《算法 导论 ),Thomas H. Cormen, 等 著 , 潘 金贵 ,等 译 ,109 页 ,9.2 节 。 
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按 每 次 迭代 中 减 去 规模 的 大 小 把 减 治 法 分 成 以 下 3 种 情况 : 

(1) 减少 一 个 常数 。 在 算法 的 每 次 迭代 中 ,把 原 问 题 减少 相同 的 常数 个 ,这 个 常数 一 般 
等 于 1。 相 关 的 算法 有 插入 排序 .图 搜索 算法 (DFS、.BFS) ,拓扑 排序 .生成 排列 .生成 子 集 
等 。 在 这 些 问题 中 ,每 次 把 问题 的 规模 减少 1 。 

(2) 按 比例 减少 。 在 算法 的 每 次 迭代 中 ,问题 的 规模 按 常 数 成 售 减少 ,减少 的 效率 极 
高 。 在 大 多 数 应 用 中 ,此 常数 因子 等 于 2。 折 半 查 找 (Binary Search) 是 最 典型 的 例子 ,在 一 
个 有 序 的 数列 中 查找 某 个 数 &, 可 以 把 数列 分 成 相同 长 度 的 两 半 , 然 后 在 包含 k 的 那 部 分 继 
续 折 半 , 直 到 最 后 匹配 到 ,总 共 只 需要 logsn 次 折 半 。 

(3) 每 次 减少 的 规模 都 不 同 。 减 少 的 规模 在 算法 的 每 次 迭代 中 都 不 同 ,例如 查找 中 位 
数 ( 用 快速 排序 的 思路 ) ,插值 查找 、 欧 几 里 得 算法 等 。 


6.4 小 结 


本 章 介绍 了 贪心 、 分 治 等 基础 算法 的 思想 ,这 些 也 是 算法 竞赛 中 常见 的 题 型 。 这 两 种 算 
法 思想 容易 理解 .容易 编程 , 若 遇 到 难 解 的 问题 ,大 家 不 妨 先 考虑 这 两 种 方法 。 
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如 动态 规划 的 概念 和 思想 
局 最 优 子 结构 和 重 登 子 问题 
局 基础 DP 和 递 推 法 

如 0/1 背包 、LCS、LIS 

如 滚动 数组 

如 记 忆 化 搜索 

名 区 间 DP 

名 树 形 DP 

各 数 位 DP 

如 状态 压缩 DP 


动态 规划 (Dynamic Programming,，DP) 题 是 算法 竞赛 中 的 必 出 题 型 。DP 算法 的 效率 
高 .代码 少 ,竞赛 队员 不 仅 需要 掌握 很 多 编程 技术 ,而 且 需 要 根据 题目 灵活 设计 具体 的 解 题 
方案 ,能 考察 其 思维 能 力 、 建 模 抽象 能 力 、 灵 活性 等 。 对 DP 的 掌握 情况 很 能 体现 竞赛 队员 
的 思维 水 平 。 

本 章 详细 展开 了 与 DP 有 关 的 算法 ,这 些 算法 是 每 个 竞赛 队员 都 应 该 掌握 的 基本 技术 。 


和 贪心 法 ,分 治 法 一 样 ,DP 并 不 是 一 个 特定 的 算法 ,而 是 一 种 算法 思想 。 

DP 算法 思想 可 以 简单 解释 如 下 : DP 问题 一 般 是 多 阶段 决策 问题 , 它 把 一 个 复杂 问题 
分 解 为 相对 简单 的 子 问题 ,再 一 个 个 解决 ,最 后 得 到 原 复杂 问题 的 最 优 解 ; 这 些 子 问 题 是 前 
后 相关 的 ,并 且 非 常 相似 ,处 理 方法 几乎 一 样 。 把 前 面子 问题 的 计算 结果 记录 为 “状态 ”, 并 
存储 在 “状态 表 ” 中 ,后 面子 问题 可 以 直接 查找 前 面 得 到 的 状态 表 , 避 免 了 重复 计算 , 极 大 地 
减少 了 计算 复杂 度 。 

DP 和 分 治 法 的 区 别 如 下 : 

(1) 分 治 法 是 把 问题 分 成 独立 的 子 问 题 ,各 个 子 问 题 能 独立 解决 ,一 个 子 问 题 内 部 的 计 
算 不 需要 其 他 子 问题 的 数据 ,例如 归并 排序 的 分 治 过 程 。 

(2) DP 的 子 问题 之 间 是 相关 的 ,前 面子 问题 的 解决 结果 被 后 面 的 子 问题 使 用 。 

DP 比分 治 法 复杂 得 多 。 

DP 适用 于 有 重 仅 子 问题 和 最 优 子 结构 性 质 的 问题 ,具体 的 解释 请 参考 算法 类 相关 
教材 。 

求解 DP 问题 有 3 步 , 即 定义 状态 ,状态 转移 、 算 法 实现 。DP 的 核心 是 状态 .状态 转移 
方程 。 用 状态 转移 方程 求解 状态 ,状态 往往 就 是 问题 的 解 。 在 DP 问题 中 ,只 要 分 析出 状态 
以 及 状态 转移 方程 ,差不多 就 完成 了 90% 的 工作 量 。 

DP 问题 可 以 分 为 线性 和 非 线 性 的 。 


算法 竞赛 入 门 到 进 阶 


(1) 线性 DP。 线 性 DP 有 两 种 方法 , 即 顺 推 与 逆 推 。 在 线性 DP 中 ,常常 用 “表格 ”来 处 
理 状态 ,用 表格 这 种 图 形 化 工具 可 以 清晰 易 懂 地 演示 推导 过 程 。 本 章 绘制 了 大 量 表格 来 介 
绍 有 关 算 法 。 

(2) 非 线 性 DP。 例 如 树 形 DP, 建 立 在 树 上 ,也 有 两 个 方向 : @ 根 一 叶 , 根 传递 有 用 的 
信息 给 子 结 点 ,最 后 根 得 出 最 优 解 ; 四 叶 一 根 , 根 的 子 结 点 传递 有 用 的 信息 给 根 , 最 后 根 得 
到 最 优 解 。 

DP 是 一 种 常用 的 算法 思想 。DP 问题 可 难 可 易 , 非 常 灵活 ,重点 在 于 对 “状态 ”和 * 转 
移 ” 的 建 模 与 分 析 。 该 算法 时 间 效 率 高 ,代码 量 少 。 在 几乎 所 有 的 现场 赛 中 都 有 DP 的 影 
子 ,而 且 常 常 作 为 中 等 题 .难题 出 现 。DP 一 直 是 算法 竞赛 中 的 重点 和 难点 。 


7.1 基 础 DP 


基础 DP 是 一 些 经 典 问题 ,非常 直观 ,易于 理解 。 这 些 问题 包括 递 推 .O/1 背包、 最 长 公 
共 子 序列 .最 长 递增 子 序列 等 ,它们 的 状态 容易 表示 ,转移 方程 容易 得 到 。 
下 面 从 简单 的 硬币 问题 开始 引导 出 动态 规划 的 概念 和 处 理 方法 。 


7.1.1 硬币 问题 


前 面 第 6 章 用 贪心 法 解决 的 最 少 硬币 问题 要 求 硬币 面值 是 特殊 的 。 对 于 任意 面值 的 硬 
币 问题 ,需要 用 动态 规划 来 解决 。 

硬币 问题 是 简单 的 递 推 问题 。 

1. 最 少 硬币 问题 


有 nn 种 硬币 ,面值 分 别 为 ,vs。，…,v, ,数量 无 限 。 输 入 非 负 整数 ;, 选 用 硬币 ,使 其 和 为 
s。 要 求 输出 最 少 的 硬币 组 合 。 
定义 一 个 数组 int MinLMONEY] ,其 中 Min[ 门 是 金额 i 对 应 的 最 少 硬币 数量 。 如 果 程 
序 能 计算 出 Min[ 门 ,0 二 i 二 MONEY. 那 么 对 输入 的 某 个 金额 i, 只 要 查 Min[ 门 就 得 到 了 
答案 。 
如 何 计 算 Min[ 门 ? Min[ 门 和 Min[i 一 1] 是 否 有 关系 ? 
下 面 以 5 种 面值 (1、5、10、25、50) 的 硬币 为 例 讲解 递 推 的 过 程 。 
(1) 只 使 用 最 小 面值 的 1 分 硬币 。 初 始 值 Min[0] 二 0, 其 他 的 Min[ 疏 为 无 穷 大 ,如 
图 7.1 所 示 。 下 面 计算 Min[1]。 
金额 0 1 2 3 4 5 6 7 8 9.. 
硬币 数量 Min[]: | | 


图 7.1 只 用 1 分 硬币 


i 二 0, MinL0j==0, 表 示 金 额 为 0, 硬 币 数量 为 0。 在 这 个 基础 上 加 一 个 1 分 硬币 ,就 前 进 
到 金额 ;一 1 、 硬 币 数量 Min[1] 一 MinL0] 十 1 一 Min[1 一 1j 十 1 二 1 的 情况 。 
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同 理 ,; 一 2 时 ,相当 于 在 Min[1] 的 基础 上 加 一 个 硬币 ,得 到 Min[2] 王 Min[2 一 1 十 1 一 
2。 继 续 这 个 过 程 ,结果 如 图 7. 2 所 示 。 
人 WE 0 1 2 3 4 56 7 8 9. 
硬币 数量 Min0:| 0 [1|1213|4afs 6| 7 8 
A A A 丰 


图 7.2 只 用 1 分 硬币 时 的 结果 
分 析 上 述 过 程 , 得 到 递 推 美 系 Min[i] 二 min(Min[i], Min[i 一 1 十 1)。 


(2) 在 使 用 1 分 硬币 的 基础 上 增加 使 用 第 二 大 面值 的 5 分 硬币 ,如 图 7.3 所 示 。 此 时 
应 该 从 MinL5] 开 始 , 因 为 比 5 分 硬币 小 的 金额 不 可 能 用 5 分 硬币 实现 。 


人 ME 0 1 2 3 4 567 8 9. 
硬币 数量 Min[:| 0 | 1 | 2 | 3 | 4 | 1[e[7|s 
Se 


图 7.3 加 上 5 分 硬币 


i 二 5 时 ,相当 于 在 ;一 0 的 基础 上 加 一 个 5 分 硬币 ,得 到 Min[5] 王 Min[5 一 5] 十 1 一 1。 
上 一 步 用 1 分 硬币 的 方案 有 Min[5]==5。 取 最 小 值 ,得 Min[5]=1。 
同 理 ,i=6 时 ,有 Min[6] 二 Min[6 一 5] 十 1 二 2, 对 比 原来 的 Min[6]=6, 取 最 小 值 。 
继续 这 个 过 程 ,结果 如 图 7.4 所 示 。 
金额 i 0 1 2 3 4 5 6 7 8 9.. 
硬币 数量 Min[]: 四 面 加 面相 四 回回 四 西 
NS 


7.4 加 上 5 分 硬币 时 的 结果 


递 推 关 系 是 Min[7==min(Min[i],，Min[i 一 5] 十 1)。 

(3) 继续 处 理 其 他 面值 的 硬币 。 

在 动态 规划 中 ,把 Min[ 详 这 样 的 记录 子 问题 最 优 解 的 数据 称 为 “状态 ”, 从 Min[i 一 1] 
或 Min[i 一 5j 到 Min[ 详 的 递 推 称 为 “状态 转移 ”。 用 前 面子 问题 的 结果 推导 后 续 子 问题 的 
解 ,逻辑 清晰 、 计 算 高 效 , 这 就 是 动态 规划 的 特点 。 

程序 代码 如 下 : 


# include < bits/stdc++.h> 
using namespace std; 


const int MONEY = 251; // 定 义 最 大 金额 
const int VALUE = 5; //5 种 硬币 
int type[ VALUE] = {1, 5, 10, 25, 50}; //5 种 面值 
int Min[ MONEY]; // 每 个 金额 对 应 最 少 的 硬币 数量 
void solve(){ 

for(int k = 0; k< MONEY; k++) // 初 始 值 为 无 穷 大 

Min[k] = INT MAX; 
Min[0] = 0; 


for(intj = 0; j < VALUE; j++) 
for(int i = type[j]; i< MONEY; i++) 


站 
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Min[i] = min(Min[i], Min[i — type[j]] + 1); // 递 推 式 
} 
int main(){ 
int s; 
solve(); // 计 算出 所 有 金额 对 应 的 最 少 硬币 数量 , 打 表 
while(cin >> s) 
cout << Min[ s] << endl; 
return 0; 


| 


solve() 的 复杂 度 是 O(VALUEXMONEY)。 

需要 注意 的 是 ,上 面 的 main() 程 序 用 到 了 “ 打 表 ”的 处 理 方法 , 即 在 输入 金额 之 前 提前 
用 solve() 算 出 所 有 的 解 , 得 到 MinLMONEY] 这 个 “ 表 ”, 然 后 再 读 取 金 额 ;, 查 表 直 接 输出 
结果 , 查 一 次 表 的 复杂 度 只 有 O(1) 。 这 样 做 的 原因 是 ,如 果 有 很 多 组 测试 数据 ,例如 10 000 
个 ,那么 总 复杂 度 是 O(VALUEXMONEY 十 10 000) ,没有 增加 多 少 。 如 果 不 打 表 ,每 次 读 
一 个 s, 就 用 solve() 算 一 次 ,那么 总 复杂 度 是 O(VALUEXMONEYX10 000) ,时 间 几 乎 多 
子 工 万 倍 。 

2. 打印 最 少 硬币 的 组 合 

在 DP 中 , 除 求 最 优 解 的 数量 之 外 ,往往 还 要 求 输出 最 优 解 本 身 , 此 时 状态 表 需 要 适当 
扩展 ,以 包含 更 多 信息 。 

在 最 少 硬币 问题 中 ,如 果 要 求 打印 组 合 方案 ,需要 增加 一 个 记录 表 Min_path[ 门 ,记录 
金额 i 需要 的 最 后 一 个 硬币 。 利 用 Min_path[] 逐 步 倒 推 ,就 能 得 到 所 有 的 硬币 。 

例如 ,金额 i=6,Min_path[6] 二 5, 表 示 最 后 一 个 硬币 是 5 分 ; 然后 ,Min_path[ 6 一 5] 二 
Min_path[1], 查 Min_path[1]==1, 表 示 接 下 来 的 最 后 一 个 硬币 是 1 分 ; 继续 Min_path[ 1 一 
1]==0, 不 需要 硬币 了 ,结束 。 输 出 结果 如 图 7.5 所 示 ,硬币 组 合 是 “5 分 十 1 分 ”。 

金额 ft 0 1 2 3 4 5 6 7 8 9.. 


Minl:[o[112[314T1T213T4[. 


Min pathl:[ o [1 [1 | 1|115 | 5|5|5 
| 
图 7.5 i 一 6 时 的 输出 结果 


#include <bits/stdc++.h> 
using namespace std; 


const int MONEY = 251; // 定 义 最 大 金额 

const int VALUE = 5; //5 种 硬币 

int type[ VALUE] = {1,5,10,25,50}; //5 种 面值 

int Min[ MONEY]; // 每 个 金额 对 应 最 少 的 硬币 数量 
int Min_path[MONEY] = {0}; // 记 录 最 小 硬币 的 路 径 


void solve(){ 
for(int k=0; k< MONEY;k++) 
Min[k] = INT MAX; 


ss 
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Min[0] = 0; 
for(int j = 0;j < VALUE;j++) 
for(int i = type[j]; i< MONEY; i++) 
if(Min[i] > Min[i - type[j]]+1){ 
Min path[i] = type[j]; // 在 每 个 金额 上 记录 路 径 , 即 某 个 硬币 的 面值 
Min[i] = Min[i - type[j]] + 1; // 递 推 式 
} 
. 
void print ans(int * Min path, int s) { // 打 印 硬币 组 合 
while(s){ 
cout << Min path[s] <<" "; 
s= s- Min pathls]; 
} 
. 
int main() { 
int s; 
solve(); 
while(cin >> s){ 
cout << Min[ s] << endl; // 输 出 最 少 硬币 个 数 
print_ans(Min_path, s); // 打 印 硬币 组 合 
} 
return 0; 


} 


3. 所 有 硬币 组 合 
有 种 硬币 ,面值 分 别 为 w ,vs，…,v, ,数量 无 限 。 输 入 非 负 整 数 ;, 选 用 硬币 ,使 其 和 为 
s。 输 出 所 有 可 能 的 硬币 组 合 。 


hdu 2069 “Coin Change” 
有 5 种 面值 的 硬币 , 即 1 分 .5 分 .10 分 .25 分 .50 分 。 输 入 一 个 钱 数 s, 输 出 组 合 方 
案 的 数量 。 例 如 11 分 有 4 种 组 合 方案 , 即 11 个 1 分 .2 个 5 分 二 1 个 1 分 .1 个 5 分 十 6 
个 1 分 .1 个 10 分 十 1 个 1 分 。s 委 250, 硬 币 数量 num<100。 


如 果 用 暴力 法 ,可 以 逐个 枚 举 各 种 面值 的 硬币 个 数 ,判断 每 种 情况 是 否 合 法 。 枚 举 量 是 
订 X 药 X10X 言 X 二 次 。 

1) 不 完全 解决 方案 

假设 硬币 数量 不 限 , 即 题目 没有 num 扫 100 的 限制 。 

定义 一 个 记录 状态 的 数组 int dp[251]。dp[ 站 表示 金额 i 所 对 应 的 组 合 方案 数 , 即 解 空 
间 。 找 到 dp[ 疏 和 dp[i 一 1 的 递 推 关系 ,就 高 效 地 解决 了 问题 。 

第 一 步 : 只 用 1 分 硬币 进行 组 合 。 

dp[L0j 二 1 为 初始 值 。 

dp[1] 可 以 从 dp[0] 推 导出 来 : 当 金额 *=1 时 ,如 果 用 一 个 1 分 硬币 ,等 价 于 从 * 中 减 
去 1 分 钱 ,并 且 硬 币 数量 也 减少 一 个 的 情况 。 此 时 退 到 i 二 0; 如 果 i 二 0 存在 组 合 方案 , 那 
么 i 一 1 的 组 合 方案 也 存在 。dp[1] 二 dp[L1] 十 dp[0]。 


下 
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对 于 其 他 dp[ 可 ,同样 有 dp[ 可 一 dp[ 详 十 dpLi 一 ]。 

在 上 述 叙 述 中 ,dp[ 详 是 “状态 ”,dp[ 让 一 dp[i 十 dp[Li 一 匡 是 状态 转移 方程 。 前 面子 问 
题 的 状态 dp[i 一 1], 用 状态 转移 方程 计算 后 ,得 到 后 面子 问题 的 状态 dp[ 让 。 

计算 可 得 表 7. 1 。 


表 7.1 只 用 1 分 硬币 时 


第 二 步 : 加 上 5 分 硬币 ,继续 进行 组 合 。 

当 i<5 时 ,组 合 中 不 可 能 有 5 分 硬币 。 

当 ;5 时 ,金额 为 ;时 的 组 合 数量 等 价 于 从 s 中 减 去 5, 而 且 硬币 数量 也 减 去 一 个 的 情 
况 。dp[ 让 二 dp[ 让 十 dp[i 一 5]。 计 算 可 得 表 7. 2。 


表 7.2 加 上 5 分 硬币 时 


第 三 步 : 继续 处 理 10 分 .25 分 .50 分 硬币 的 情况 , 同 理 有 dp[ 让 =dp[ 让 十 dp[C: 一 10]、 
dp[i]=dp[i]+dp[i—25] .dp[i]=dp[i]+dp[i—50]。 

在 上 述 步骤 中 ,一 次 计算 的 复杂 度 只 有 O(1) ,全 部 计算 的 复杂 度 只 有 OCks),k 是 不 同 
面值 硬币 的 个 数 ,s 是 最 大 金额 。 

程序 如 下 : 


#include < bits/stdc++.h> 
using namespace std; 
const int MONEY = 251; // 定 义 最 大 金额 
int type[5] = {1, 5, 10, 25, 50}; //5 种 面值 
int dp[MONEY] = {0}; 
void solve() { 
dp[0] = 1; 
Bovl nt = Od) 
for(int j = type[i]; j < MONEY; j++) 
dp[j] = dp[j] + dp[j - type[li]]; 
} 
int main() { 
int s; 
solve(); // 提 前 计算 出 所 有 金额 对 应 的 组 合 数量 , 打 表 
while(cin >> s) 
cout << dp[ s] << endl; 


return 0; 
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2) 完全 解决 方案 


上 述 程序 有 一 个 问题 ,没有 考虑 对 硬币 数量 的 限制 ,hdu 2069 题 要 求 硬币 不 能 多 于 100 
个 。 这 是 因为 状态 dp[ 详 太 简单 ,没有 记录 计算 过 程 中 的 细节 。 

重新 定义 状态 为 dp[z[7 门 ,建立 一 个 “转移 矩阵 ”, 如 表 7. 3 所 示 。 其 中 ,横向 是 金额 ( 题 
目 中 i250) ,纵向 是 硬币 数 ( 题 目 中 最 多 用 100 个 硬币 ,j 委 100) 。 


表 7.3 转移 矩阵 
a 1 3 4 5 6 8 9 10 
0 1 
1 1 
2 1 1 
3 1 | 
4 1 1 
5 
6 1 
7 1 
100 
和 矩阵 元 素 dp[ 让 [jj] 的 含义 是 用 j 个 硬币 实现 金额 i 的 方案 数量 。 例 如 表 7. 3 中 


dp[6][2]=1, 表 示 用 两 个 硬币 凑 出 6 分 钱 , 只 有 一 种 方案 , 即 5 分 十 1 分 。 该 表 中 的 空格 为 
0, 即 没有 方案 ,例如 dp[6J[1] 二 0; 用 一 个 硬币 次 6 分 钱 ,不 存在 这 样 的 方案 。 该 表 中 列 出 
了 dp[1o][7] 以 内 的 方案 数 。 

矩阵 元 素 dp[][D 就 是 解 空间 。 该 表 中 纵 坐 标 相 加 ,就 是 某 金额 对 应 的 方案 总 数 , 例 如 6 
分 的 金额 为 dpL6JL2] 十 dpL6]L6] 二 2, 有 两 种 硬币 组 合 方案 。 

“状态 转移 ”的 特征 是 用 和 矩阵 前 面 的 状态 dp[ 妆 [7] 能 推算 出 后 面 状 态 的 值 。 步 又 如 下 : 

第 一 步 : 只 用 1 分 硬币 实现 。 

初始 化 : dpL0][o]=1, 其 他 为 0。 定义 int type[5]={1, 5, 10, 25, 50} 为 5 种 硬币 的 
面值 。 

从 dp[0][Lo] 开 始 , 可 以 推导 后 面 的 状态 。 例 如 ,dp[1][1] 是 dp[o][0o] 进 行 “ 金 额 十 1、 
硬币 数量 十 1" 后 的 状态 转移 。 转 移 后 组 合 方案 数量 不 变 , 即 dp[1J[1] 二 dp[L0J[0]=1。 

这 里 还 要 考虑 dp[1][1] 原 有 的 方案 数 , 递 推 关系 修正 为 : 

dp[L1J[1]=dp[L1j[1]+dp[L0J[0]=dp[L1j[1]+dp[1—1J[1—1j=0+1=1 

dp[1 一 1J[1 一 1 的 意思 是 从 1 分 金额 中 减 去 1 分 硬币 的 钱 ,原来 1 个 硬币 的 数量 也 减 
2 

在 程序 中 ,把 上 述 操作 写成 : 

dp[1J[1]=dp[L1J[1]+dp[1—typeL0JJ[1—1] 


wa 
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对 所 有 dp[ 详 [7 门 进行 上 述 操作 ,结果 如 表 7.4 所 示 。 
表 7.4 只 用 1 分 硬币 时 
0 1 2 3 4 5 6 7 8 9 10 
0 
区 

1 
加 证 到 国 
3 1 
4 
5 i 
和 证 本 六 
1 1 
100 


第 二 步 : 加 上 5 分 硬币 ,继续 进行 组 合 。 

dp[ 让 [7 门 , 当 ;i5 时 ,组 合 中 不 可 能 有 5 分 硬币 。 

当 i 三 5 时 ,金额 为 i 硬币 为 j 个 的 组 合 数量 等 价 于 从 i 中 减 去 5 分 钱 ,而 且 硬 币 数量 
也 减 去 1 个 ( 即 这 个 面值 5 的 硬币 ) 的 情况 。dp[i][j]= dp[i][jj 十 dp[i 一 5J[j 一 1] 
dp[ 让 [站 十 dp[i 一 type[1]J[j 一 1]。 对 所 有 dp[ 让 [ 门 进行 上 述 操作 ,结果 如 表 7.5 所 示 。 


表 7.5 加 上 5 分 硬币 时 


0 1 2 3 4 5 6 7 8 9 10 

0 1 

L 1 四 

2 1 1 -1 

3 1 一 1 

4 1 1 

5 ] l 

6 1 1 

1 | 

100 

第 三 步 : 陆续 加 上 10 分 .25 分 .50 分 硬币 , 同 理 有 以 下 关系 。 

dp[LiJ[j]=dp[Lijljj+dpLi—typeLk]jLj—1],k=2, 3, 4 


总 结 上 述 过 程 ,每 个 状态 dp[ 门 [站 都 可 以 根据 它 前 面 已 经 算出 的 状态 进行 推导 ,复杂 
度 为 0(1) ,总 复杂 度 为 O(kmn) ,k 是 不 同 面值 硬币 的 个 数 ,m 和 是 矩阵 的 大 小 。 

利用 dp[ 疏 [站 也 很 容易 找到 某 金 额 对 应 的 最 少 和 最 多 硬币 数量 。 例 如 金额 5, 最 少 硬 
币 数量 是 dp[5J[1] 二 1, 最 多 硬币 数量 是 dp[5][5] 二 5。 
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下 面 给 出 代码 。 
hdu 2069 代码 
井 include <bits/stdc++.h> 
using namespace std; 
const int COIN = 101; // 题 目 要 求 不 超过 100 个 硬币 
const int MONEY = 251; // 题 目 给 定 的 钱 数 不 超 过 250 
int dp[ MONEY][COIN] = {0}; //DP 转移 矩阵 
int type[5] = {1, 5, 10, 25, 50}; //5 种 面值 
void solve() { //DP 


dp[0][0] = 1; 
for(int i=0; i<5; i++) 
for(int j=1; j<COIN; j++) 
for(int k = type[i]; k < MONEY; k++) 
dp[k][j] += dp[k- type[li]][j-1]; 
) 


int main() { 


int s; 

int ans[MONEY] = {0}; 

solve(); // 用 DP 计算 完整 的 转移 矩阵 

for(int i=0; i<MONEY; i++) // 对 每 个 金额 计算 有 多 少 种 组 合 方案 , 打 表 
for(int j=0; j<COIN; j++) // 从 0 开始 ,注意 dp[0][0] =1 


ans[i] += dp[i][j]; 
while(cin >> s) 
cout << ans[s] << endl; 
return 0; 


7.1.2 0/1 背包 


0/1 背包 是 最 经 典 的 DP 问题 ,没有 之 一 。 

背包 问题 : 有 多 个 物品 ,重量 不 同 、 价 值 不 同 , 以 及 一 个 容量 有 限 的 背包 ,选择 一 些 物品 
装 到 背包 中 , 问 怎么 装 才能 使 装 进 背 包 的 物品 总 价值 最 大 。 根 据 不 同 的 限定 条 件 , 可 以 把 背 
包 问 题 分 为 很 多 种 ,常见 的 有 下 面 两 种 : 

(1) 如 果 每 个 物体 可 以 切 分 , 称 为 一 般 背 包 问 题 ,用 贪心 法 求 最 优 解 。 比 如 吃 自助 餐 ， 
在 饭量 一 定 的 情况 下 ,怎么 吃 才能 使 吃 到 肚子 里 的 最 值钱 ? 显然 应 该 从 最 贵 的 食物 吃 起 , 吃 
完了 最 贵 的 再 吃 第 2 贵 的 ,这 就 是 贪心 法 。 

(2) 如 果 每 个 物体 不 可 分 割 , 称 为 0/1 背包 问题 。 仍 以 吃 自助 餐 为 例 ,这 次 食物 都 是 一 
份 份 的 ,每 一 份 必须 吃 完 。 如 果 最 贵 的 食物 一 份 就 超过 了 你 的 饭量 , 那 只 好 放弃 。 这 种 问题 
无 法 用 贪心 法 求 最 优 解 。 

1. 0/1 背包 问题 

给 定 n 种 物品 和 一 个 背包 ,物品 i 的 重量 是 w; ,价值 为 v;, 背 包 的 总 容量 为 C。 在 装 和 人 
背包 的 物品 时 对 每 种 物品 i 只 有 两 种 选择 , 即 装 入 背包 和 不 装 入 缘 包 ( 称 为 0/1 背包 )。 如 
何 选 择 装 入 背包 的 物品 ,使 得 装 入 背包 中 的 物品 的 总 价值 最 大 ? 

“ 23.% 
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设 zx; 表示 物品 i 装 入 背包 的 情况 , 当 zi 一 0 时 不 装 和 背包, 当 xz; 一 1 时 装 人 背包 ,有 以 
下 约束 条 件 和 目标 函数 。 
约束 条 件 : 


Dwizi<C XE{01}, l1<i<<n 
i=1 
目标 函数 : 
max > vx; 
i=1 


2. 用 DP 求解 0/1 背包 H 
后 面 的 描述 都 基于 这 个 例子 , 有 4 个 物品 ,其 重量 分 别 是 2、3、6、5, 价 值 视频 讲解 
分 别 为 6.3、5、4, 背 包 的 容量 为 9。 
引进 一 个 (xn 十 1)X(C 十 1) 的 二 维 表 dp[][], 可 以 把 每 个 dp[ 详 [7 都 看 成 一 个 背包 ， 
dp[ 门 [ 门 表示 把 前 i 个 物品 装 入 容量 为 ;的 背包 中 获得 的 最 大 价值 ,i 是 纵 坐 标 ,j 是 横 坐 标 。 
填 表 按照 只 装 第 1 个 物品 、 只 装 前 两 个 物品 .只 装 前 3 个 物品 的 顺序 ,直到 装 完 ,如 
图 7.6 所 示 。 这 是 从 小 问题 扩展 到 大 问题 的 过 程 。 
背包 容量 一 0 2 3 4 5 6 沉 8 9 
不 装 一 0 
装 第 1 个 一 1 
装 前 2 个 一 2 
3 
4 


装 前 3 个 一 
装 前 4 个 一 
图 7.6 填 表 的 过 程 
步骤 1: 只 装 第 1 个 物品 。 
由 于 物品 1 的 重量 是 2, 所 以 背包 容量 小 于 2 的 都 放 不 进去 ,得 dp[1J[0]==dp[1J[1]= 
0; 物品 1 的 重量 等 于 背包 容量 , 装 进去 ,背包 价值 等 于 物品 1 的 价值 ,dpL1][L2]=6; 容量 大 
于 2 的 背包 ,多 余 的 容量 用 不 到 ,所 以 价值 和 容量 2 的 背包 一 样 ,如 图 7.7 所 示 。 


o 
© 
o 
I olb 
© 
© 
© 
o 
© 
© 
3 


WiI=2, v1=6 1 0 0 
图 7.7 只 装 第 1 个 物品 


步骤 2: 只 装 前 两 个 物品 。 

如 果 物 品 2 的 重量 比 背包 容量 大 ,那么 不 能 装 物品 2, 情 况 和 只 装 第 1 个 物品 一 样 。 

下 面 填 dpL2]L3]。 物 品 2 的 重量 等 于 背包 容量 ,那么 可 以 装 物品 2, 也 可 以 不 装 ， 

(1) 如 果 装 物品 2( 重 量 是 3) ,那么 相当 于 只 把 物品 1 装 到 (容量 一 3) 的 背包 中 ,如 图 7.8 
所 示 。 
(2) 如 果 不 装 物品 2, 那 么 相当 于 只 把 物品 1 装 到 背包 中 ,如 图 7.9 所 示 。 
取 (1) 和 (2) 的 最 大 值 ,得 dp[2][3] 二 max{3,6} 二 6。 
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0 1 2 3 4 5 6 7 8 9 

ofo 0 0 0 0 0 0 0 0 

wa2m6 1|0 0 6 6 6 6 6 6 
w3m3 2|0 0 >340 

7.8 装 物品 2 

CE 9 

ofo 0 0 0 0 0 0 0 0 0 

w=2m6 1|0 0 6 6 6 6 6 6 6 6 
WwW2=3, vi=3 2 0 0 6 0 


图 7.9 不 装 物品 2 
后 续 步 又 : 继续 以 上 过 程 , 最 后 得 到 图 7. 10( 图 中 的 箭头 是 几 个 例子 ) 。 


J 区 

Co EE 

w=2m6 1|0 0 6 6 6 6 6 6 6 6 
w3w3 2|0 0 6 6 9 9 9 9 9 
w6wu5 3|0 0 56 ER 这 1 
wsSm4 4|0 0 6 6 6 9 9>I0 1l 


7.10 最 终结 果 


最 后 的 答案 是 dpL4][9], 即 把 4 个 物品 装 到 容量 为 9 的 背包 ,最 大 价值 是 11 。 

其 算法 复杂 度 是 O(nC)。 

3. 输出 0/1 背包 方案 

现在 回头 看 具体 装 了 哪些 物品 ,需要 倒 过 来 观察 : 

dp[4][9] 一 max{dp[3][4] 十 4,dp[3][9]}=dp[3][9], 说 明 没有 装 物品 4, 用 zx 二 0 
表示 ， 

dp[3j[9] 二 max{dp[2J][3j 十 5, dp[2J[9j]}== dp[2jJ[3j 十 5==11, 说 明 装 了 物品 3， 
Xs=1; 

dp[2]L3] 王 max{dp[1][0] 十 3,dp[1][3]} 王 dp[1][3], 说 明 没 有 装 物品 2,zs 一 0; 

dp[1J[3] 二 max{dp[L0JL1J 十 6,dpL0JL3]} 二 dpL0JL1J] 十 6 二 6, 说 明 装 了 物品 1,x1 一 1。 

图 7.11 中 的 实 线 箭头 指出 了 方案 的 路 径 。 


0 1 人 2 36 7 9 

太太 在 抱 仙 区 
mi=2.v=6 1|0.. 0 6 
wv3 2|0 0 6> 4 9 9 9 9 9, w0 
wm6w=5 3|0 0 6 i =1 
wm4 4|0 0 6 6 6 9 9 10 ii> 艳 xi=0 


图 7.11 查看 具体 装 了 哪些 物品 
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4. 例题 


hdu 2602“Bone Collector” 

“骨头 收集 者 ” 带 着 体积 为 V 的 背包 去 捡 骨头 ,已 知 每 个 骨头 的 体积 和 价值 , 求 能 装 
进 背 包 的 最 大 价值 。N 志 1000,V 志 1000。 

输入 : 第 1 行 是 测试 数量 ,第 2 行 是 骨头 数量 和 背包 体积 ,第 3 行 是 每 个 骨头 的 价 
值 ,第 4 行 是 每 个 骨头 的 体积 。 

1 

5 10 

12345 

54321 

输出 : 最 大 价值 。 

14 


代码 如 下 : 


#include < bits/stdc++.h> 
using namespace std; 
struct BONE{ 
int val; 
int vol; 
}bone[1011]; 
int T,N,V; 
int dp[1011][1011]; 
int ans(){ 
memset (dp, 0, sizeof (dp) ); 
for(int i=1; i<=N; i++) 
for(int j=0; j<=V; j++){ 


if(bone[i].vol > j) // 第 并 个 物品 太 大 , 装 不 了 
dp[i][j] = dp[i-1]0]， 
else // 第 并 个 物品 可 以 装 


dp[i][j] = max(dp[i- 1][j], 
dp[i-1][j- bone[i].vol] + bone[i].val); 
} 
return dp[N][V]; 
} 
int main(){ 
cin>>T; 
while(T-—— ){ 
cin> N>V; 
for(int i=1;i<=N;i+t+) cin>> bone[i].val; 
for(int i=1;i<=N;i+t+) cin>> bone[i].vol; 
cout << ans() << endl; 
} 


return 0; 
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作为 练习 ,请 读者 自己 加 上 打印 方案 的 程序 。 
5. 滚动 数组 
在 处 理 dp[][] 状 态 数 组 的 时 候 有 一 个 小 技巧 : 把 它 变 成 一 维 的 dp 口 , 以 节省 空间 。 观 
察 上 面 的 二 维 表 dpLJ][] 可 以 发 现 ,每 一 行 是 从 上 面 一 行 算出 来 的 ,只 跟 上 面 一 行 有 关系 , 跟 
更 前 面 的 行 没有 关系 。 那 么 用 新 的 一 行 覆 盖 原 来 的 一 行 就 可 以 了 。 
hdu 2602( 滚 动 数 组 程序 ) 


int dp[1011]; // 替 换 int dp[1011][1011]; 
int ans(){ 
memset(dp, 0, sizeof(dp)); 
for(int i=1; i<=N; i++) 
for(int j=V; j>=bone[i].vol; j-- ) // 反 过 来 循环 
dp[j] = max(dp[j],dp[j ~ bone[i].vol] + bone[i].val); 
return dp[V]; 


注意 ,j 应 该 反 过 来 循环 , 即 从 后 面 往 前 面 覆盖 。 请 读者 思考 原因 。 

经 过 滚动 数组 的 优化 ,空间 复杂 度 从 OCNV) 减 少 为 OCV) 。 

动态 规划 题 经 常会 给 出 很 大 的 N\V, 此 时 需要 使 用 滚动 数组 ,否则 会 MLE。 

滚动 数组 也 有 缺点 , 它 覆 盖 了 中 间 转 移 状态 ,只 留 下 了 最 后 的 状态 ,所 以 损失 了 很 多 信 
息 ,导致 无 法 输出 背包 的 方案 。 


【习题 】 


滚动 数组 请 练习 : 

hdu 1024 “Max Sum Plus Plus”; 
hdu 4576“Robot”; 

hdu 5119“Happy Matt Friends”。 


7.1.3 最 长 公共 子 序列 


一 个 给 定 序列 的 子 序 列 是 在 该 序列 中 删 去 若干 元 素 后 得 到 的 序列 。 例 如 X= (4A,B， 
C,B,D,A,B),X 的 子 序列 有 (A,B,C,B,A)、(A,B,D)、(B,C,D,B) 等 。 子 序列 和 子 串 是 
不 同 的 概念 , 子 串 的 元 素 在 原 序列 中 是 连续 的 。 

给 定 两 个 序列 X 和 YY, 当 另 一 序列 Z 既是 X 的 子 序列 又 是 Y 的 子 序列 时 , 称 Z 是 序列 
X 和 YY 的 公共 子 序列 。 最 长 公共 子 序列 是 长 度 最 长 的 子 序列 。 

最 长 公共 子 序列 (Longest Common Subsequence,LCS) 问 题 : 给 定 两 个 序列 X 和 YY, 找 
出 X 和 Y 的 一 个 最 长 公共 子 序列 。 

用 暴力 法 找 最 长 公共 子 序列 需要 先 找 出 X 的 所 有 子 序列 ,然后 验证 是 否 为 Y 的 子 序 
列 。 如 果 和 X 有 mz 个 元 素 , 那 么 X 有 2"” 个子 序列 , 若 Y 有 nn 个 元 素 , 总 复杂 度 大 于 OCn2”)。 

用 动态 规划 求 LCS ,复杂 度 是 O(nm)。 


a 
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例如 ,序列 X 王 (aocyj,b,c) 了 一 (aocya 0) ,如 图 7.12 所 示 。 

用 工 [可 [ 门 表示 子 序 列 X; 和 YY; 的 最 长 公共 子 序列 的 长 度 。 

当 Xi 二 Y; 时 , 找 出 XX;_!1 和 YY;-1 的 最 长 公共 子 序列 ,然后 在 其 尾部 加 上 X; 即 可 得 到 X 
和 Y 的 最 长 公共 子 序列 。 

当 X; 隆 Y; 时 ,求解 两 个 子 问题 : @ 求 X;_1 和 YY; 的 最 长 公共 子 序列 ; @ 求 X 和 YY;-1 的 
最 长 公共 子 序列 。 然 后 取 其 中 的 最 大 值 。 


L[i—1j[t;—1j+1 0 
L[iJ[Lj] = 
max{L[i][D—1j,L[Li—1]D]} X;#¥Y,i>0;j>0 


下 面 举例 说 明 前 几 个 步骤 。 
步骤 1: 求 L[1J[1]。 有 Xi 二 Yi ,得 LLI]LI]=LLo][o] 十 1 一 1, 如 图 7.13 所 示 。 


0 | 2 3 次 源 十 
-A 
a 1 
b 2 
3 F a 0 ff e a 3 
f 4 J 
b $ 全 0 0 0 0 0 0 0 0 
ce 6 @ Mo 2 

图 7.12 序列 X 和 Y 图 7.13 求 L[1J[1] 


步骤 2: 求 LL1]L2]。 有 Xi 天 Y: ,得 L[1j[2] 二 max{L[1J[1],LL0J[2]}==1, 如 图 7.14 


后 续 步 又 : 继续 以 上 过 程 , 最 后 得 到 图 7.15,L[L6]L6] 就 是 答案 。 


二 a pb f/f cc a b 

i 

和 0|o 0 0 0 0 0 0 

| 0 

3 | 

二 a bb / c a b 闪 3 0 1 2 2 3 3 3 

0 1 2 3 4 556 f 4|0 1 2 3 3 3 3 

让 0|0 oo 0 0 0 0 | 

a 1|o0 1>1V & 六 | 站 而 六 和 过 条 
图 7.14 求 L[1J[2] 图 7.15 最 终结 果 


如 果 要 输出 方案 ,和 0/1 背包 的 输出 方案 一 样 ,LCS 需要 从 后 面倒 推 回 去 。 
下 面 给 出 一 个 例题 。 


hdu 1159 “Common Subsequence” 
求 两 个 序列 的 最 长 公共 子 序列 。 
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代码 如 下 : 


# include <bits/stdc++.h> 
using namespace std; 
int dp[ 1005][1005]; 
string strl, str2; 
int LCS(){ 
memset (dp, 0, sizeof(dp)); 
for(int i=1; i<= strl. length(); i++) 
for(int j=1; j<= str2. length(); j++){ 
if(strl[i-1] == str2[j-1]) 
dp[il[j] = dp[i-1][j-1] + 1; 
else 
dp[i][j] = max(dp[i-1][j]， dp[i][j-1]); 
} 
return dp[ str1. length()][str2. length() ] ; 
} 
int main(){ 
while(cin >> strl >> str2) 
cout << LCS() << endl; 
return 0; 


} 


读者 可 以 练习 输出 方案 ,并 改 为 滚动 数组 。 
7.1.4 最 长 递增 子 序列 

最 长 递增 子 序 列 (Longest Increasing Subsequence,LIS) 问 题 : 给 定 一 个 长 度 为 N 的 数 
组 , 找 出 一 个 最 长 的 单调 递增 子 序列 。 例 如 一 个 长 度 为 7 的 序列 A 二 {5,6,7,4,2,8,3), 它 


最 长 的 单调 递增 子 序列 为 {5,6,7,8) ,长 度 为 4。 
下 面 给 出 一 个 例题 。 


hdu 1257“ 最 少 拦截 系统 ” 

某国 有 一 种 导弹 拦截 系统 ,这 种 导弹 拦截 系统 有 一 个 缺陷 : 虽然 它 的 第 1 发 炮弹 能 
够 到 达 任 意 高 度 , 但 是 以 后 每 一 发 炮弹 都 不 能 超过 前 一 发 的 高 度 。 某 天 ,雷达 捕捉 到 敌 
国 的 导弹 来 袭 ,请 计算 最 少 需 要 多 少 套 拦截 系统 。 

输入 : 导弹 总 个 数 ,导弹 依 此 飞 来 的 高 度 。 

输出 : 最 少 要 配备 多 少 套 这 种 导弹 拦截 系统 。 

输入 样 例 : 

8 389 207 155 300 299 170 158 65 

输出 样 例 : 

2 


这 一 题 可 以 用 贪心 法 做 。 假 设 发 射 了 很 多 高 度 无 穷 大 的 导弹 ,在读 和 第 1 个 炮弹 时 ,一 
个 导弹 下 降 来 拦截 。 以 后 每 读 入 一 个 新 的 炮弹 ,都 由 能 拦截 它 的 最 低 的 那个 导弹 来 拦截 。 
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最 后 统计 用 于 拦截 的 导弹 的 个 数 ,也 就 是 最 少 需 要 的 拦截 系统 的 套数 (请 读者 思考 能 否 用 这 
个 贪心 思想 求 最 长 递增 子 序列 ) 。 

下 面 用 DP 来 做 。 

这 个 题目 的 思维 转换 有 一 些 难度 。 题 目的 意思 是 统计 一 个 序列 中 的 单调 递减 子 序列 最 
少 有 多 少 个 。 这 和 最 长 递增 子 序列 LIS 有 什么 关系 呢 ? 

假设 已 经 有 了 求 LIS 的 算法 ,读者 可 能 想 这 么 做 : 把 序列 反 过 来 ,就 变 成 了 求 反 序列 的 
递增 子 序列 ; 先 求 反 序列 的 第 1 个 LIS, 然 后 从 原 序列 中 去 掉 这 个 LIS, 再 对 剩 下 的 求 第 2 
个 LIS, 直 到 序列 为 空 ; 这 些 LIS 的 数量 就 是 题目 的 解 。 

但 是 ,其 实 并 不 用 这 么 麻烦 ,这 个 题目 实际 上 等 价 于 求 原 序列 的 LIS, 这 是 一 道 求 LIS 
的 裸 题 ,下面 解释 原因 。 

模拟 计算 过 程 : 从 第 1 个 数 开 始 , 找 一 个 最 长 的 递减 子 序列 , 即 第 1 个 拦截 系统 X， 
在 样 例 中 是 {389,300,299,170,158,65) ,去 掉 这 些 数 ,序列 中 还 剩 下 {207,155};@ 在 剩 下 的 
序列 中 再 找 一 个 最 长 递减 子 序列 , 即 第 2 个 拦截 系统 Y, 是 {207,155)。 

在 Y 中 ,至 少 有 一 个 数 a 大 于 X 中 的 某 个 数 ,否则 a 比 X 的 所 有 数 都 小 ,应 该 在 X 中 。 
所 以 ,从 每 个 拦截 系统 中 拿 出 一 个 数 能 构成 一 个 递增 子 序列 , 即 拦截 系统 的 数量 等 于 这 个 递 
增 子 序列 的 长 度 。 如 果 这 个 递增 子 序列 不 是 最 长 的 ,那么 可 以 从 某 个 拦截 系统 中 拿 出 两 个 
数 c.d ,在 拦截 系统 中 c>d,c 和 4d 不 是 递增 的 ,这 与 递增 序列 的 要 求 矛盾 。 

有 多 种 方法 可 以 求 LIS。 

(1) 方法 1: 上 一 节 刚 讲解 了 最 长 公共 子 序列 LCS, 读 者 也 许 能 想到 借助 LCS。 首 先 对 
序列 排序 ,得 到 A' 二 {2,3,4,5,6,7,8) ,那么 A 的 LIS 就 是 A 和 A' 的 LCS。 其 复杂 度 是 
O(n )。 

(2) 方法 2: 直接 用 DP 求解 LIS。 

定义 状态 dp[ 计 ,表示 以 第 i 个 数 为 结尾 的 最 长 递增 子 序列 的 长 度 , 那 么 : 

dp[]=max{0,dp[jj]}+1, 0<j<i,A,<A; 

最 后 答案 是 max{dp(i) } 。 

方法 2 的 复杂 度 也 是 O(n?) ,和 方法 1 一 样 。 

代码 如 下 : 


hdu 1257(DP 程序 ) 


#include < bits/stdc++.h> 
using namespace std; 
const int MAXN = 10000; 
int n, high[ MAXN]; 
int LIS(){ 
int ans = 1; 
int dp[ MAXN]; 
dp[1] = 1; 
for(int i = 2; i<=n; i++){ 
int max = 0; 
for(int j=1; j<i; j++) 
if(dp[j] >max && high[j] < high[i]) 
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mx = dp[j]; 
dp[i] = maxt+1; 
if(dp[i] > ans) ans = dp[i]; 
} 
return ans; 
. 
int main(){ 
while(cin >> n){ 
for(int i=1; i<=n; i++) 
cin >> high[i]; // 输 入 炮弹 高 度 值 
cout << LIS() << endl; 
. 
return 0; 


} 


(3) 方法 3: 有 一 种 更 快 的 复杂 度 为 O(zlog:z) 的 方法 。 这 个 方法 不 是 DP 算法 , 它 巧 
妙 地 利用 了 序列 本 身 的 特征 ,通过 一 个 辅助 数组 d[] 统 计 最 长 递增 子 序 列 的 长 度 。 

定义 : 数组 d[]; len 统计 d[] 内 数据 的 个 数 ; high[] 为 原始 序列 。 

初始 化 : d[1]==high[1]; len=1; 

操作 步骤 : 逐个 处 理 high[] 中 的 数字 ,例如 处 理 到 了 high[k],@ 如 果 high[&j 比 d[] 末 
尾 的 数字 更 大 ,就 加 到 dD] 的 后 面 ; @ 如 果 high[k] 比 d[] 未 尾 的 数字 小 ,就 替换 d[] 中 第 1 
个 大 于 它 的 数字 。 
以 high[] 二 {4,8,9,5,6,7) 为 例 , 表 7.6 所 示 为 具体 的 操作 过 程 。 


表 7.6 方法 3 的 具体 操作 过 程 
high[] d[] len 说 明 


1 | 48595567 | 了 1 | 初始 值 4[1]=high[1] 

2 4,8, 9, 5,6,7 | 48 2 | high[2]>d[L1], 加 到 <] 的 后 面 

3 4,8,9, 5, 6,7 | 489 3 | d[] 后 面 加 上 9 

4 | 4,8,9,5,6,7 |459 3 |5 比 d[] 末 尾 的 9 小 ,用 5 替换 <d[] 中 第 1 个 比 5 大 的 数 8 
5 4, 8, 9, 5,6,7 | 456 3 | 用 6 替换 9 

6 4,，8, 9,5,6,7 |4567 | 4 | 4d[0] 后 面 加 上 7 


结束 后 ,len 一 4, 就 是 LIS 的 长 度 。 

为 什么 d[] 的 长 度 等 于 high[] 的 LIS 的 长 度 ? 分 析 算法 对 high[] 的 两 个 关键 操作 : 

(1)“ 如 果 high[8] 比 d[] 末 尾 的 数字 更 大 ,就 加 到 d[] 后 面 ",high[] 的 LIS 加 1,d[] 的 
长 度 加 1, 没有 问题 。 

(2)“ 如 果 high[Lkj 比 iD 末尾 的 数字 小 ,就 替换 d[] 中 第 1 个 大 于 它 的 数字 ”, 有 两 个 作 
用 : 首先 ,这 个 操作 不 影响 LIS 的 长 度 ,也 不 影响 d[] 的 长 度 ; 其 次 ,high[j 后 面 还 没有 处 理 
的 数 很 多 都 比 已 经 处 理 过 的 数 小 ,但 是 有 可 能 序列 更 长 ,这 里 的 替换 给 后 面 更 小 的 数字 留 下 
了 机 会 。 为 什么 用 high[L8] 替 换 d[ 中 第 1 个 比 它 大 的 数字 ? 因为 数字 high[k] 可 能 在 LIS 
中 ,而 被 它 蔡 换 的 数字 由 于 更 大 ,不 在 LIS 中 的 可 能 性 更 大 。 
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在 下 面 的 代码 中 ,对 于 “替换 d[] 中 第 1 个 大 于 它 的 数字 ”这 个 功能 ,用 STL 的 lower_ 
bound( 函 数 帮 助 找到 这 个 数 ,lower_bound() 的 复杂 度 是 O(logsn)。 程 序 的 总 复杂 度 是 
O(nlogzn) 2。 


hdu 1257( 非 DP 程序 ) 


int LIS(){ 
int len = 1; 
int d[ MAXN]; 
d[1] = high[1]; // 初 始 化 
for (int i=2; i<=n; i++){ //0(n) 
证 (high[i] > d[ len]) // 符 合 递增 的 要 求 ,加 入 
d[++len] = high[i]; 
else{ // 蔡 换 


int j = lower bound(d+1,d+len+1,high[i])-d; //0(logn) 
d[j] = high[i]; 
} 
| 


return len; 


7.1.5 基础 DP 习题 


(1) 简单 题 : 

hdu 2018/2041/2044/2050/2182/4489 。 

(2) 背包 : 

有 0/1 背包 、 完 全 背包 、 分 组 背包 、 多 重 背包 等 。 
hdu 1864“ 最 大 报销 额 ”,0/1 背包 。 

hdu 2159“FATE”, 完 全 背包 。 

hdu 2844“Coins” ,多重 背 包 。 

hdu 2955“Robberies”,0/1 背包 。 

hdu 3092“Least common multiple”, 完 全 背包 十 数论 。 
poj 1015 “Jury Compromise”。 

poj 1170“Shopping Offers” ,状态 压缩 背包 。 
(3) LIS: 

hdu 1003“Max Sum”, 最 大 连续 子 序列 。 

hdu 1087 “Super Jumping!”。 

hdu 4352“XHXJ's LIS”, 数 位 DP 十 LIS。 

poj 1239“Increasing Sequence”, 两 次 dp。 

(4) LCS: 

hdu 1503“Advanced Fruits”,LCS 变形 。 


@ 最 长 不 下 降 子 序列 是 类 似 的 问题 。 
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poj 1080“Human Gene Functions”, LCS 变形 。 


7.2 递 推 与 记忆 化 搜索 


前 面 讲解 DP 的 状态 转移 都 是 用 递 推 的 方法 ,另外 还 有 一 种 方法 ,逻辑 上 的 理解 更 加 直 


接 , 这 就 是 用 “递归 十 记忆 化 搜索 ”来 实现 DP。 


先 看 一 道 经 典 题 。 


层 。 
数字 和 是 多 少 ? 


poj 1163“The Triangle” 
给 定 一 个 寻 层 的 三 角形 数 塔 ,从 顶部 第 1 个 数 往 下 走 , 每 层 经 过 一 个 数字 ,直到 最 底 
注意 ,只 能 走 斜 下 方 的 左边 一 个 数 或 右边 一 个 数 。 问 所 有 可 能 走 到 的 路 径 , 最 大 的 


此 题 如 果 按 “从 顶 往 下 ”的 计算 方法 , 则 由 于 可 能 有 2" 个 路 径 ,导致 TLE。 请 读者 思考 


为 什么 会 有 2" 个 路 径 。 


更 快 的 方法 是 “从 底 往 上 ?计算 。 按 动态 规划 的 思路 ,对 760 

数 堪 上 的 每 个 点 记录 状态 ,dp[ 门 [站 记录 从 第 i 层 第 j 个 数 开 9 J 
Ss (20) (13) (10) 

从 往 下 走 的 数字 和 ,每 个 结 点 算 一 次 ,一 共有 O02 ) 个 结 点 ,所 20) 702 400 400) 
以 复杂 度 是 O0z2 ) 。 计 算 过 程 如 图 7. 16 所 示 ,括号 内 的 数字 “3 5 ?9 6 55 
是 dp[i[]: 图 7.16 数 堪 

递 推 代码 如 下 : 

int a[150][150]; //a[i][j] 是 数 塔 第 并 层 的 第 j 个 数 

int dp[150][150]; //dp[i][j] 记 录 从 第 i 层 第 j 个 数 开始 往 下 走 的 数字 和 

for(int j=1; j<=n;j++) dp[n][j] = a[n][j]; // 先 计算 最 后 一 层 

for(int i=n-1;i>=1;i-—) // 从 倒数 第 2 层 往 上 走 到 第 1 层 

for(int j=1;j<= i;j++) // 从 左边 走 上 来 ,或 者 从 右边 走 上 来 , 取 其 中 较 大 的 


dp[il[j] = a[i]l[j] + max(dp[i+1][j], dp[i+1][j+1]); 


下 面 用 “递归 十 记忆 化 搜索 ”重新 写 DP。 
首先 写 出 递归 程序 ,搜索 所 有 可 能 的 路 径 。 


int dfs(int i, int j) { 
if(i == n) 
return a[ i][j]; // 递 归 边 界 :到 达 最 后 一 行 ,返回 
return dp[i][j] = max(dfs(i+1, j), dfs(i+1, j+1)) + a[li][j]; 
// 从 左边 走 上 来 ,或 者 从 右边 走 上 来 , 取 其 中 较 大 的 


} 


秆 总 


这 个 dfs() 程 序 和 前 面 “搜索 技术 ”一 章 中 讲解 的 DFS 一 样 ,是 暴力 搜索 所 有 可 能 的 情 


。 读 者 可 以 手工 模拟 递归 过 程 ,执行 dfs(1,1) ,程序 一 直 递 归 到 最 底部 的 第 层 , 然 后 未 


退 ,最 后 回 到 最 项 部 的 第 1 层 。 最 后 的 结果 在 dpL1JL1] 中 。dfs() 的 递归 有 2" 次 ,暴力 
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搜索 了 所 有 的 2" 个 路 径 ,复杂 度 和 前 面 最 先 提 到 的 “从 项 往 下 ”的 计算 次 数 一 样 。 

这 个 递归 程序 能 优化 吗 ? 可 以 观察 到 ,其 中 有 大 量 重复 计算 ,其 实 是 能 避免 的 。 例 如 ， 
观察 图 7. 16 中 第 3 层 的 中 间 数 “1”, 从 第 2 层 的 “3” 往 下 走 会 经 过 “1”, 计 算 一 次 从 “1” 出 发 
的 递归 ; 从 第 2 层 的 “8” 往 下 走 也 会 经 过 “1”, 又 重新 计算 了 从 “1” 出 发 的 递归 。 所 以 ,只 要 
避免 这 些 重复 计算 就 能 优化 。 

下 面 的 代码 加 上 了 “记忆 化 搜索 ”的 内 容 : 


// 把 dp[][] 初 始 化 为 -1 
int dfs(int i, int j) { 
if(i == n) 
return a[ i][j]; 
if(dp[i][j] >=0) // 记 忆 ! 如 果 计 算 过 ,就 不 再 递归 重 算 
return dp[i][j]; 
return dp[i][j] = max(dfs(i+1,j), dfs(i+1,j+1))+a[i][j]; 
上 


其 中 “idp[i[j] >= 0) return dp[i][0j];” 实 现 了 “记忆 化 搜索 ”。 

加 上 这 一 行 代码 后 ,如 果 发 现 dp[ 门 [ 门 已 经 计算 过 ,就 不 再 重 算 。 由 于 数 塔 的 结 点 有 
On) 个 ,每 个 点 只 需要 计算 一 次 dp[ 让 [7 门 ,所 以 dfs() 的 运行 次 数 只 有 OC ) 次 ,和 递 推 程 
序 的 复杂 度 一 样 。 这 样 ,就 把 暴力 搜索 的 O(2") 次 计算 优化 到 了 OCG) 次 计算 。 记 忆 化 搜 
索 的 优化 能 力 是 惊人 的 。 

记忆 化 搜索 。 在 用 递归 实现 DP 时 ,在 递归 程序 中 记录 计算 过 的 状态 ,并 在 后 续 的 计算 
中 跳 过 已 经 算 过 的 重复 的 状态 ,从 而 大 大 减少 递归 的 计算 次 数 ,这 就 是 “记忆 化 搜索 ”的 
思路 。 

在 很 多 情况 下 ,记忆 化 搜索 ”的 逻辑 思路 和 程序 比 直 接 写 递 推 更 简单 。 在 本 书 "7.5 数 
位 DP” 中 有 相关 的 例子 。 


7.3 区 间 DP 


区 间 DP 的 主要 思想 是 先 在 小 区 间 进 行 DP 得 到 最 优 解 ,然后 再 利用 小 区 间 的 最 优 解 合 
并 求 大 区 间 的 最 优 解 。 

区 间 DP ,一 般 需要 从 小 到 大 枚 举 所 有 可 能 的 区 间 。 在 解 题 时 , 先 解 决 小 区 间 问 题 ,然后 
合并 小 区 间 ,得 到 更 大 的 区 间 ,直到 解决 最 后 的 大 区 间 问 题 。 合 并 的 操作 一 般 是 把 左右 两 
个 相 邻 的 子 区 间 合 并 。 

区 间 DP 的 两 个 难点 : 枚 举 所 有 可 能 的 区 间 、 状 态 转移 方程 。 

区 间 DP 的 复杂 度 : 一 个 长 度 为 n 的 区 间 . 它 的 子 区 间 数 量 级 为 O(n? ) ,每 个 子 区 间 内 
部 处 理 时 间 不 确定 , 合 起 来 复杂 度 会 大 于 O(mw*)。 在 编程 时 ,区 间 DP 至 少 需要 两 层 for 循 
环 ,第 1 层 的 i 从 区 间 的 首部 或 尾部 开始 ,第 2 层 的 ) 从 i 开始 到 结束 ,i 和 j 一 起 枚 举 出 所 
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有 的 子 区 间 。 例 如 : 


for(int i=1;i<n;it+) //n 是 区 间 长 度 
for(int j=i;j<=n;j+t+) //j 每 次 递增 1, 也 可 能 跨 步 递增 
下 面 用 两 个 经 典 问题 讲解 。 
1. 石子 合并 
“石子 合并 ” 


及 n 堆 石子 排 成 一 排 , 每 堆 石 子 有 一 定 的 数量 ,将 nn 堆 石子 合并 成 一 堆 。 合 并 的 规 
则 是 每 次 只 能 合并 相 邻 的 两 堆 石子 ,合并 的 花费 为 这 两 扒 石子 的 总 数 。 石 子 经 过 7 一 1 
次 合并 后 成 为 一 堆 , 求 总 的 最 小 花费 。 

输入 : 有 多 组 测试 数据 ,输入 到 文件 结束 。 每 组 测试 数据 的 第 1 行 有 一 个 整数 nn, 表 
示 有 nn 堆 石子 ,n 二 250。 接 下 来 的 一 行 有 nn 个 数 ,分 别 表 示 这 nn 堆 石 子 的 数目 。 每 堆 石 
子 至 少 1 颗 ,最 多 10 000 颗 。 

出 : 总 的 最 小 花费 。 

输入 样 例 : 

3 

245 

输出 样 例 : 

17 


样 例 的 计算 过 程 是 : @@ 第 一 次 合并 2 十 4=6; @ 第 二 次 合并 6 十 5 二 11; 总 花费 是 
6 十 11 一 17。 

DP 的 状态 如 何 设 计 ? 设 dp[ 让 [7 门 为 从 第 守 堆 石子 到 第 ) 堆 石 子 的 最 小 花费 ,那么 
dp[1j[nj 就 是 答案 。 另 外 , 设 sum[ 站 [站] 为 从 第 i 到 j 的 区 间 的 和 。 


为 了 计算 最 后 的 dp[1][n], 需 要 考虑 所 有 可 能 的 合 ”一 yw 
并 。 这 些 合并 包括 : @lelololelolololo) 


(1) 合并 之 前 ,dp[i][i]=0,1<i<n。 图 7.17 两 堆 合并 
(2) 两 堆 合 并 ,如 图 7.17 所 示 。 
例如 : dp[1j[2]=dp[1j[1] 十 dp[2J[2j] 十 sum[1][2j]; 
结 : dp[][i 十 1j==dp[i][ 订 十 dp[i 十 1j[i 十 1J 十 sum[ij[i 十 1]; 
(3) 三 堆 合 并 ,如 图 7.18 所 示 。 
例如 合并 第 1 堆 到 第 3 堆 , 有 两 种 情况 ,如 图 7. 19 所 示 。 


SO 人 zi 0 


图 7.18 三 堆 合 并 图 7.19 两 种 情况 
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dp[1]L3] 王 min(dpL1]L1] 十 dpL2][3],dpL1]L2] 二 dpL3]L3]) 十 sum[1]L3]; 

总 结 : dp[ 习 [i 十 2 二 min(dp[][ 习 十 dp[i 十 1J[i 十 2j,dp[[i 十 1j 十 dp[i 十 2j[i 十 2j]) 十 
sum[i][i+2]; 

(4) 推广 : 第 i 堆 到 第 j 堆 的 合并 ,如 图 7. 20 所 示 。 ~ 

dp[Lij[j]= min(dp[i]j[Lk] 二 dp[L# 二 1j[jj) 十 
sum[ 让 [j 一 i 十 1],i<kj。 这 就 是 状态 转移 方程 。 0odobooboe 

下 面 的 函数 Minval() 实 现 了 上 述 计算 过 程 , 其 中 有 
3 层 循环 : 

(1) 最 外 面 一 层 的 变量 len 表示 区 间 [i, 站 的 长 度 , 从 2 到; 

(2) 第 二 层 枚 举 的 起 点 位 置 i 从 1 到 一 len, 终 点 通过 计算 得 到 ,j= 二 i 十 len; 

(3) 在 区 间 [i, 门 里 枚 举 每 个 分 割 的 位 置 。 

虽然 下 面 的 代码 很 短 ,但 是 逻辑 比较 复杂 ,请 读者 仔细 体会 并 能 自己 写 出 来 。 


7.20 第 i 堆 到 第 j 堆 的 合并 


#include <bits/stdc++.h> 
using namespace std; 
const int INF = 1 << 30; 
const int N = 300; 
int sum[N], n; 
int Minval() { 
int dp[ NJ][N]; 
for(int i=1; i<=n; i++) 


dp[i][i] = 
for(int len=1; len<n; len++) //len 是 i 和 j 之 间 的 距离 
for(int i=1; i<=n- len; i++){ // 从 第 i 堆 开 始 
intj = i + len; // 到 第 j 堆 结束 
dp[i][j] = 
for(int k=i; k<j; k++) //i 和 上 j 之 间 用 k 进 行 分 割 


dp[i][j] = min(dp[i][j], 
dp[i][k] + dp[k +1][j] + sum[j] ~ sum[i—1]); 
} 
return dp[1][n]; 
} 
int main() { 
while(cin>>n) { 
sum[0] = 0; 
for(int i=1; i<=n; i++) { 
int x; 
cin>> x; 
sum[i] = sum[i—1]+x; //sum[i,j] 的 值 等 于 sun[j] - sun[i-1] 
} 
cout << Minval( ) << endl; 
} 
return 0; 


} 


复杂 度 : Minval() 中 有 三 重 循环 ,复杂 度 是 00 )。 所 以 上 述 算法 只 能 用 来 处 理 规模 
72<250 的 问题 。 
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那么 Minval() 是 否 可 以 优化 ? 在 它 的 三 重 循环 中 ,前 两 重 循环 是 枚 举 所 有 可 能 的 合 
并 ,无 法 优化 ,最 后 一 层 循环 枚 举 分 割 点 ,是 可 以 优化 的 。 因 为 每 次 运行 最 后 一 层 循环 时 
都 在 某 个 子 区 间 内 部 寻找 最 优 分 割 点 ,该 操作 在 多 个 子 区 间 里 是 重复 的 。 如 果 找 到 这 个 最 
优点 后 保存 下 来 ,用 于 下 一 次 循环 ,就 能 避免 重复 计算 ,从 而 降低 复杂 度 。 

用 s[ 避 [jj] 表示 区 间 [i, 站 中 的 最 优 分 割 点 ,第 三 重 循环 可 以 从 区 间 [i,j 一 1) 的 枚 举 优化 
到 区 间 [s[ 习 一 1j,s[i 十 1J[7]j 的 枚 举 。 其 中 ,s[][] 值 是 在 前 面 的 第 三 重 循环 中 找到 并 记 
录 下 来 的 。 

上 述 讨论 符 合 "平行 四 边 形 优化 ”的 原理 , 它 是 区 间 DP 的 常见 优化 方法 。 请 读者 自行 
了 解 并 掌握 。 

经 过 优化 以 后 ,复杂 度 接近 OC ), 可 以 解决 n 二 3000 的 问题 。 上 面 的 程序 只 需要 修改 
3 处 ,在 下 面 的 代码 中 使 用 斜体 显示 : 


int Minval() { 
int dp[ NJ][N], s[N][N]; 
for(int i=1; i<=n; i++){ 
dp[li][i] = 0; 
sliJ[i] = i // 初 始 值 
} 
for(int len=1; len<n; len++) 
for(int i=1; i<=n-len; i++) { 
intj = i+ len; 
dp[i][j] = INF; 
for(int k = s[iJ[j-1]; k<=s[i+1][j]; k++ ) // 缩 小 范围 
if(dp[i][k] + dp[k +1][j] + sum[j]— sum[i—1]<dp[i][j]){ 
dp[i][j] = dp[i][k] + dp[k+1][j]+ sum[j] ~ sum[i— 1]; 
s[iJ[j] = k; // 记 录 [i, j] 的 最 优 分 割 点 
} 
} 
return dp[1][n]; 
} 


2. 回 文 串 
回 文 串 是 正 读 和 反 读 都 一 样 的 字符 串 ,例如 "abcdcba"。 回 文 串 问题 是 经 典 的 字符 串 问 
题 : 给 定 一 个 字符 串 ,然后 通过 增加 或 删除 部 分 字符 串 得 到 一 个 回 文 串 。 


poj 3280“Cheapest Palindrome” 

给 定 字符 串 s, 长 度 为 m, 由 n 个 小 写字 母 构 成 。 在 s 的 任意 位 置 增删 字母 ,把 它 变 
为 回 文 串 ,增删 特定 字母 的 花费 不 同 。 求 最 小 花费 。 

输入 样 例 : 

34 

abcb 

a 1000 1100 

b 350 700 

c 200 800 
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输出 样 例 : 
900 
输入 的 第 1 行 是 个 字符 ,长 度 为 m; 第 2 行 是 字符 串 ,后 面 行 分 别 给 出 每 个 字符 
插入 和 删除 的 花费 。 
在 样 例 中 ,如 果 在 结尾 处 插入 "a" ,得 到 "abcba" ,花费 1000; 如 果 在 首 端 删除 "a" 得 到 
"bcb" ,花费 1100; 如 果 在 首 端 插入 "bcb" ,花费 350 十 200 十 350 王 900, 这 是 最 小 值 。 
该 题 有 多 种 解法 ,其 中 一 种 是 把 * 反 转 得 到 , 求 得 两 者 最 长 公共 子 序列 的 长 度 1, 用 ; 
的 长 度 减 去 / 就 是 答案 。 
下 面 用 区 间 DP 的 方法 求解 。 
定义 状态 dp[ 门 [ 门 表示 字符 串 s 的 子 区 间 s[i,j] 变 成 回 文 的 最 小 花费 。 
另外 ,在 考虑 删除 和 插入 的 花费 时 ,由 于 这 两 种 操作 是 等 价 的 (这 头 加 和 那 头 减 一 样 )， 
所 以 只 要 取 这 两 种 操作 的 最 小 值 就 行 了 。 用 数组 w[] 定 义 字 符 的 花费 。 


有 以 下 3 种 情况 : 
(1) 如 果 s[ 疏 = 二 5s[ 让 ,那么 dp[ 习 [站 二 dp[i 十 1J[ 一 1j, 如 图 7.21 所 示 。 
so[*T*T*TT*T*TeT*T*T:] 
TT 个 个 个 
i itl 六 ] 间 
图 7.21 情况 1 


sD | “ 


图 7.22 情况 2 


(3) 如 果 dp[ 妆 [一 1 是 回 文 串 , 那 么 dp[i[j] 二 dp[i][j 一 1] 十 w[jj。 
总 结 情况 2、3 ,状态 转移 方程 是 dp[i[j] 二 min(dp[i 十 1J[jj 十 w[i],， dp[ij[j 一 1J 十 


w[Lj])。 
该 程序 中 包含 两 层 循环 ,外 层 i 枚 举 子 区 间 起 点 ,内 层 ; 枚 举 终点 。 因 为 需要 从 小 区 间 


扩展 到 大 区 间 , 所 以 i 从 s 的 尾 端 开 始 ,逐步 回 退 扩大 区 间 ,直到 首 端 。 
poj 3280 程序 


# include < iostream> 


using namespace std; 
int w[30],n,m, dp[2005][2005]; 


char s[2005], ch; 
int main() { 


int x,y; 
//n 是 用 到 的 字符 个 数 ,nm 是 s 的 长 度 


while(cin>>n>>nm) { 
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cin>> 8s; 


for(int i=0;i<n;i++) { 


cin> ch> x>y; // 读 取 每 个 字符 的 插入 和 删除 的 花费 
wch— 'a'] =min(x, y); // 取 其 中 的 最 小 值 

} 

for(int i=m-1; i>=0; i-——) //i 是 子 区 间 的 起 点 
for(int j=i+1; j<m; j++) { //j 是 子 区间 的 终点 


if(s[i] == s[j]) 
dp[il][j] = dp[i+1][j-1]; 
else 
dp[il[j] = min(dp[i+1][j] + w[s[i]- 'a'], 
dp[il[j-1] + wls[j]- ‘a']); 
} 
cout << dp[0][m- 1]<< endl; 
| 


return 0; 


【习题 】 


hdu 3506“Monkey Party” ,环形 石子 合并 。 
hdu 4283“You Are the One” ,区间 DP。 

hdu 4632“Palindrome Subsequence”, 回 文 串 。 
hdu 2476“String Printer”, 区间 DP。 

hdu 4745“Two Rabbits”, 最 长 回 文子 序列 。 
hdu 5115“Dire Wolf”, 区 间 DP。 

poj 1141“Brackets Sequence”, 括 号 匹配 。 

poj 2955“Brackets”, 区 间 DP。 


7.4 树 形 DP 


树 形 DP 是 指 在 “ 树 ” 这 种 数据 结构 上 进行 的 DP: 给 出 一 棵 树 , 要 求 以 最 少 的 代价 (或 
取得 最 大 收益 ) 完 成 给 定 的 操作 。 通 常 这 类 问题 规模 较 大 , 枚 举 算 法 的 效率 低 ,无 法 胜任 , 贪 
心算 法 不 能 得 到 最 优 解 ,因此 需要 用 动态 规划 。 

在 树 上 做 动态 规划 显得 非常 合适 ,因为 树 本 身 有 “ 子 结构 "性质 ( 树 和 子 树 ), 具 有 递 
归 性 ,符合 DP 的 性 质 。 相 比 线性 DP, 树 形 DP 的 状态 转移 方程 更 加 直观 。 不 过 ,由 于 
“ 树 ” 这 种 数据 结构 比较 烦琐 ,逻辑 上 比较 复杂 ,状态 转移 方程 不 好 设计 ,常常 属于 比较 难 
的 题目 。 

树 的 操作 一 般 需 要 利用 递归 和 搜索 ,用 户 需要 熟练 地 掌握 这 些 基础 知识 。 
般 是 从 根 结 点 往 子 结 点 方向 深入 ,用 DFS 编程 会 比较 简单 。 

下 面 从 一 个 最 基础 的 树 形 DP 开始 。 


树 的 遍历 一 
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一 哥 有 根 树 上 每 个 结 点 有 一 个 权 值 , 相 邻 的 父 结 点 和 子 结 点 只 能 选择 一 个 , 问 如 何 
选择 使 得 总 权 值 之 和 最 大 (邀请 员工 参加 宴会 ,为 了 避免 员工 和 直属 上 司 发 生起 砍 , 规 
定员 工 和 直属 上 司 不 能 同时 出 席 ) 。 

输入 : 结 点 编号 从 1 到 N。 第 1 行 是 一 个 数字 N,1 三 N6000。 后 续 NN 行 中 的 每 
一 行 都 包含 结 点 的 权 值 ,范围 是 一 128 到 127 的 整数 。 下 面 是 丁 行 ,描述 一 个 父子 关系 ， 
每 一 行 都 有 如 下 形式 : 


LK 


第 区 个 结 点 是 第 工 个 结 点 的 父 结 点 。 读 到 0 0 时 结束 。 
输出 : 输出 总 的 最 大 权 值 。 


hdu 1520 “Anniversary Party” 


输入 样 例 : 
1 
1 
1 
1 
1 
3 
PF 
童 可 
35 
00 
输出 样 例 : 
3 
Q 图 7.23 是 样 例 的 树 结构 。 当 结 点 选 1.2、5 时 有 最 大 值 3。 读 
者 可 以 思考 ,如 果 用 暴力 的 方法 遍历 所 有 的 情况 ,复杂 度 是 多 少 。 
I 呵 根据 DP 的 解 题 思路 ,定义 状态 为 ， 
dp[ 让 [0o] ,表示 不 选择 当前 结 点 时 的 最 优 解 ， 
one dp[ 引 [1] ,表示 选择 当前 结 点 时 的 最 优 解 。 
状态 转移 方程 有 两 种 情况 : 
图 7.23 样 例 的 树 形 关系 。 (1 ) 不 选择 当前 结 点 ,那么 它 的 子 结 点 可 选 可 不 选 , 取 其 中 的 
最 大 值 : 


dp[Luj[L0]+=max(dpLsonJ[1], dpLsonjLo]) 
(2) 选择 当前 结 点 ,那么 它 的 子 结 点 不 能 选 ,dp[Luj][1] 十 二 dp[Lson]L0j]。 
程序 包含 3 个 部 分 : 


(1) 竺 


E 树 。 本 题 可 以 用 STL 的 vector 生成 链表 ,建立 关系 树 。 


(2) 树 的 遍历 。 可 以 用 DFS, 从 根 结 点 开始 进行 记忆 化 搜索 。 
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(3) DP。 


# include <bits/stdc++.h> 
using namespace std; 
const int N = 6000+5; 
int value[N], dp[N][2], father[N], n; 
vector < int > tree[N]; 
void dfs(int u){ 
dp[u][0] = 0; 
dp[u][1] = value[u]; 
for(int i=0;i<tree[u]. size();i++){ 
int son = tree[u][i]; 
dfs(son); 
dp[u][0] += max(dp[ son][1], dp[ son][0]); 


dp[u][1] += dp[son][0]; 
} 
} 
int main(){ 
while(~scanf("%d",gn)) { 
for(int i=1;i<=n;it+) { 
scanf("%d",&value[i]); 
tree[i].clear(); 
father[i] = -1; 
} 
while(1) { 
int a,b; 
Scanf(" % dg%d", &a, &b); 
if(a== 0&&b==0) break; 
tree[b]. push_back(a); 
father[a] = b; 
} 
intt = 1; 
while(father[t] != —1) 
t = father[t]; 
dfs(t); 
Printf(" % d\n", max(dp[t][1], dp[t][0])); 
} 
return 0; 


// 赋 初 值 :不 参加 宴会 

// 赋 初 值 :参加 宴会 

// 逐 一 处 理 这 个 父 结 点 的 每 个 子 结 点 
// 深 搜 子 结 点 


// 父 结 点 不 选 , 子 结 点 可 选 可 不 选 
// 父 结 点 选择 , 子 结 点 不 选 


// 赋 初 值 , 还 未 建立 关系 


// 用 邻接 表 建 树 
父子 关系 


// 查 找 树 的 根 结 点 


// 从 根 结 点 开始 ,用 DFS 遍历 整 棵 树 


复杂 度 : 上 述 代码 遍历 每 个 结 点 ,总 复杂 度 是 O(n)。 
下 面 是 一 个 中 等 难度 的 树 形 DP 的 题目 ,逻辑 和 状态 转移 都 比较 复杂 。 


hdu 2196 “Computer” 
一 棵 有 根 树 , 根 结 点 的 编号 是 1, 对 其 中 的 任意 一 个 结 点 , 求 离 它 最 远 的 结 点 的 


距离 。 
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输入 : 输入 文件 包含 多 个 测试 用 例 。 每 个 用 例 的 第 1 行 是 一 个 自然 数 N(N 达 
10 000) ,后 面 有 N 一 1 行 。 第 i 行 包 含 两 个 自然 数 : 某 个 结 点 ; 第 i 个 结 点 连接 到 这 个 
结 点 的 距离 ,距离 长 度 不 超过 10 ^9 。 

输出 : 输出 N 行 。 第 i 行 是 距离 第 i 个 结 点 的 最 远 距 离 。 

输入 样 例 : 

5 

下 寺 

| 

| 

1 

输出 样 例 : 

3 

入 

k: 

4 

4 


复杂 度 分 析 : 如 果 求 从 一 个 特定 结 点 出 发 的 最 长 路 径 ,可 以 从 这 个 结 点 出 发 ,做 一 次 
BFS, 每 次 扩展 邻居 结 点 ,并 记录 到 这 个 邻居 结 点 的 最 长 距离 ,复杂 度 是 O(n)。 求 所 有 个 
结 点 的 最 长 距离 ,需要 对 每 个 结 点 单独 做 一 次 BFS, 总 复杂 度 是 O(n:)。 但 是 由 于 题目 规模 
较 大 ,N 和 10 000, 所 以 算法 的 复杂 度 最 多 只 能 是 O(nlogzn)。 下 面 用 动态 规划 求解 。 

一 棵 有 根 树 如 图 7. 24 所 示 。 


以 结 点 4 为 例 , 它 的 最 长 距离 分 两 种 情况 讨论 : 

(1) 以 4 为 顶点 的 子 树 ( 图 7. 24 左边 圈 起 的 部 分 ) 距 结 点 
4 的 最 远 距离 Li 。 对 结 点 4 来 说 , 它 的 Li 很 容易 求 , 只 要 从 结 
点 4 出 发 对 它 的 子 树 做 一 次 DFS, 记 录 最 大 深度 ,就 能 求 得 
L1。 那 么 如 何 求 得 树 上 所 有 结 点 的 Li 值 ? 可 以 从 根 结 点 1 开 
始 DFS, 人 遍历 所 有 的 结 点 ,在 DFS 返回 的 过 程 中 记录 每 个 结 点 
的 最 大 深度 , 即 这 个 结 点 的 L; 值 (在 下 面 的 程序 中 实际 上 计算 
了 每 个 结 点 的 两 个 距离 。 以 结 点 4 为 例 ,这 两 个 距离 是 以 4 为 

图 7.24 一 棵 有 根 树 顶点 的 最 长 距离 one, 即 Li 值 ; 以 4 为 顶点 的 第 2 长 距离 

two) 。 

(2) 剩 下 部 分 (图 7. 24 右边 圈 起 的 部 分 ) 到 结 点 4 的 最 长 距离 L: 。L: 王 父 结 点 2 的 最 
长 距离 十 dist(2,4) ,dist(2,4) 是 2 和 4 之 间 的 距离 。 求 L, 的 关键 是 求 父 结 点 2 的 最 长 距 
离 , 它 又 分 两 种 情况 : 

@ 从 结 点 2 往 上 走 的 最 长 距离 ,图 中 路 径 是 2-1-3。 这 可 以 通过 DFS 不 断 更 新 结 点 来 
获得 ,具体 操作 见 下 面 的 程序 。 

结 点 2 除了 结 点 4 以 外 的 其 他 子 树 的 最 长 距离 X, 图 中 路 径 是 2-5-8-9。 在 上 面 第 
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(1) 步 中 已 经 求 得 了 每 个 结 点 的 最 长 距离 one 和 次 长 距离 two。 如 果 结 点 4 在 父 结 点 2 的 
最 长 子 树 上 ,那么 XX 二 two 十 dist(2,4); 如 果 结 点 4 不 在 父 结 点 2 的 最 长 子 树 上 ,那么 X= 
one 十 dist(2 ,4) 。 


综 上 所 述 ,距离 结 点 4 最 远 的 距离 是 max{Li ,L;)。 在 程序 中 ,用 dfsl() 实 现 功能 (1)， 


用 dfs20) 实 现 功能 (2) 。 


状态 的 设计 : 结 点 i 的 子 树 到 i 的 最 长 距离 dp[ 让 [0j] 以 及 次 长 距离 dp[ 疏 [1]; 从 结 点 i 


E 上 走 的 最 短 距离 dp[ 引 [2]。 


#include <bits/stdc++.h> 
using namespace std; 
const int N = 10100; 
struct Node{ 
int id; // 子 结 点 的 编号 
int cost; 
}; 
vector < Node > tree[N]; 
int dp[N][3]; 
int n; 
void init read(){ 
for(int i=1; i<=n; i++) 
tree[i].clear(); 
memset(dp, 0, sizeof(dp)); 
for(int i=2; i<=n; i++) { 
int x,y; 
scanf(" %d%d",&x,&y); 
Node tmp; 
tmp.cost = y; 
tmp. id= i; 
tree[x]. push_back(tmp); 


// 人 是 x 的 子 结 点 


} 
void dfsl(int father) { 
int one= 0, two= 0; 
for(int i=0; i<tree[father]. size(); i++) { 


// 遍 历 结 点 father 的 所 有 子 结 点 


//DFS, 先 处 理子 结 点 ,再 处 理 父 结 点 


Node child = tree[father][i]; 


dfsi(child. id); 


// 递 归 子 结 点 ,直到 最 底层 


int cost = dp[child. id][0] + child.cost; 


if(cost >= one) { 
two = one; 
one = cost; 
} 
if(cost < one && cost > two) 
two = cost; 
} 
dp[father][0] = one; 
dp[father][1] = two; 
} 
void dfs2(int father) { 


// 用 one 记录 从 father 往 下 走 的 最 长 距离 
// 原 来 的 最 长 距离 one 变 成 第 2 长 ,用 two 记录 


// 用 two 记录 第 2 长 的 距离 


// 得 到 以 father 为 起 点 的 子 树 的 最 长 距离 
// 得 到 以 father 为 起 点 的 子 树 的 第 2 长 距离 


// 先 处 理 父 结 点 ,再 处 理子 结 点 
二 全 十 


算法 竞赛 入 门 到 进 阶 


for(int i=0; i<tree[father].size(); i++) { 
Node child = tree[father][i]; 
if(dp[child. id][0] + child.cost == dp[father][0]) 
//child 在 最 长 距离 的 子 树 上 
dp[child. id][2] = max(dp[father][2], dp[father][1]) + child. cost; 
else //child 不 在 最 长 距离 的 子 树 上 
dp[child. id][2] = max(dp[father][2], dp[father][0]) + child.cost; 
dfs2(child. id); 
: 
} 


int main(){ 
while(~scanf("%d", gn)) { 


init_read(); // 初 始 化 ,读数 据 
dfs1(1); // 计 算 dp[][0]、dp[][1] 
dp[1][2] =0; 

dfs2(1); // 计 算 dp[][2] 


for(int i=1; i<=n; i++) 
printf("% d\n", max(dp[i][0], dp[i][2])); 
} 
return 0; 


} 


复杂 度 : dfs1() 和 dfs2() 的 复杂 度 约 为 O(n)。 
【习题 】 


下 面 题目 的 难度 都 在 中 等 以 上 。 
poj 2378/3107/3140; 
hdu 1011/1561/2242/3586/5834。 


7.5 数 位 DP 


先 从 一 道 简单 题 引 出 数位 DP 的 概念 。 


hdu 2089“ 不 要 62” 
一 个 数字 ,如 果 和 包含 '4' 或 者 '62', 它 是 不 吉利 的 。 给 定 m 和 nn,0 二 m 二 n 二 10' ,统计 
[m, nj 范围 内 吉利 数 的 个 数 。 


这 一 题 的 数据 范围 是 10° ,但 是 此 类 题目 常常 达到 10*。 暴 力 方 法 是 检查 每 一 个 数 ， 
复杂 度 大 于 O(n)。 由 于 nn 太 大 ,肯定 会 超时 ,需要 设计 一 个 时 间 复 杂 度 接近 O(logzn) 的 

读者 很 容易 想到 排除 法 。 基 本 思路 是 在 0 一 10* 内 排除 不 符合 条 件 的 数 ,具体 操作 是 按 
“从 高 位 到 低位 ”的 顺序 进行 判断 。 例 如 , 求 1 一 999 999 内 不 包含 4 的 数 (对 数字 '62' 的 处 理 
方法 类 似 ) ,步骤 如 下 : 
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(1) 在 6 位 数 中 排除 最 高 位 是 4 的 数 , 即 400 000 一 499 999。 虽 然 有 10 万 个 数 , 但 只 需 
要 判断 最 高 位 ,一 次 就 全 排除 了 。 

(2) 在 最 高 位 不 是 4 的 6 位 数 中 排除 次 高 位 是 4 的 数 。 例 如 最 高 位 是 1 的 数 可 以 一 
次 性 排除 140 000 一 149 999, 共 1 万 个 。 注 意 , 首 位 可 以 是 0, 即 000 000 一 099 999 也 算 
6 位 数 。 

(3) 继续 排除 5 位 数 、4 位 数 等 ,直到 结束 。 

下 面 用 数位 DP 的 方法 实现 上 述 排除 法 的 思路 。 

所 谓 “ 数 位 DP”, 是 指 对 数字 的 “位 ”进行 的 与 计数 有 关 的 DP。 一 个 数 有 个 位 .十 位 、 百 
位 、 千 位 等 , 数 的 每 一 位 就 是 数位 。 数 位 DP 用 来 解决 与 数字 操作 有 关 的 问题 ,例如 数位 之 
和 问题 ,特定 数字 问题 等 。 这 些 问 题 的 特征 是 给 定 的 区 间 超 级 大 ,不 能 用 暴力 的 方法 逐个 检 
查 ,必须 用 接近 O(logzn) 复 杂 度 的 算法 。 解 题 的 思路 是 用 DP 对 “数位 ”进行 操作 ,记录 已 经 
算 过 的 区 间 的 状态 ,用 在 后 续 计 算 中 ,快速 进行 大 范围 的 筛选 。 

回头 考虑 hdu 2089 题 ,统计 所 有 的 吉利 数 , 用 DP 怎么 做 ? 下 面 用 两 种 方法 实现 DP， 
一 种 用 递 推 公式 ,一 种 用 记忆 化 搜索 。 

1. 用 递 推 实现 hdu 2089 题 

定义 状态 dp[ 门 [ 门 , 它 表示 i 位 数 中 首位 是 j ,符合 要 求 的 数 的 个 数 。 例 如 dp[6][1] 表 
示 首 位 是 1 的 6 位 数 , 即 100 000 一 199 999 中 符合 要 求 的 数 有 多 少 个 。 那 么 如 何 求 dp[6J[1]? 
计算 首位 数字 1 后面 的 5 位 数 就 可 以 了 , 即 计算 00 000 一 99 999 中 符合 要 求 的 数 。 所 以 ， 
dp[ 杂 [站 的 递 推 公式 如 下 、: 


dp[iJ[j] = Ddp[i—1J[k], G8#4)88 (kz288.j 6) 
k=0 


下 面 是 程序 。 为 了 突出 对 数位 DP 思路 的 理解 ,程序 简化 了 题目 的 要 求 , 只 排除 了 '4'， 
没有 排除 "62"。 作 为 练习 ,读者 可 以 自己 加 上 对 "62" 的 处 理 。 从 下 面 的 程序 可 知 , 求 
dp[ 疏 [站 的 计算 复杂 度 极 小 ,i\j、&k 的 三 重 循环 只 需要 计算 1000 次 。 


统计 [0,n] 内 不 含 4 的 数字 个 数 ( 递 推 程序 ) 


# include < bits/stdc++.h> 


const int LEN = 12; // 可 以 更 大 
int dp[LEN][10]; //dp[i][j] 表 示 i 位 数 ,第 1 个 数 是 j 时 符合 条 件 的 数字 数量 
int digit[LEN]; //digit[i] 存 第 i 位 数字 


void init(){ 
dp[0][0]=1; 
for(int i=1; i<= LEN; i++) 
for(int j=0; j<10; j++) 
for(int k=0; k<10; k++) 
if(j!= 4) // 排 除数 字 4 
dp[i][j] += dp[i—1][k]; 
} 
int solve(int len) { // 计 算 [0,n] 区 间 满 足 条 件 的 数字 个 数 
int ans = 0; 
for(int i= len; i>=1; i-- ){ // 从 高 位 到 低位 处 理 
for(int j=0; j<digit[i]; j++) 
if(j!= 4) 


算法 竞赛 入 门 到 进 阶 


ans += dp[ i][j]; 
if(digit[i] == 4) { // 第 位 是 4, 以 4 开头 的 数 都 不 行 
ans -一 ; break;} 
} 
return ans; 
' 
int main(){ 


int n,len = 0; 


init(); // 预 计算 dp[][] 
scanf(" %d", gn); 
while(n){ //len 是 n 的 位 数 .例如 n= 324, 是 3 位 数 ,len=3 


digit[++len] = n%10; 
// 例 如 n= 324,digit[3] =3, digit[2] =2, digit[1] = 4 
n/=10; 
} 
printf(" % d\n", solve(len) + 1); // 求 [0,n] 内 不 含 4 的 数字 个 数 
return 0; 


} 


程序 中 的 init() 是 预 处理 , 求 dp[j[], 如 表 7.7 所 示 ( 这 里 只 画 了 部 分 箭头 ) 。 
表 7.7 dp[ 订 [ 门 的 计算 


0 1 2 3 4 5 6 7 8 9 10 
0 1 一 = 1—i 9 一 六 81 729 
1 L BD 81 729 
2 1 9 81 729 
3 1 9 81 729 
4 0 0 0 0 
5 1 9 81 729 
6 1 9 81 729 
7 1 9 81 729 
8 1 9 81 729 
9 1 9 81 729 


然后 用 solve() 完 成 题目 的 计算 。 题 目 要 求 计算 给 定 范 围 内 符合 要 求 的 数 ,那么 把 相应 
的 dp[ 妇 [站 相 加 即 可 (加 的 时 候 需 要 判断 '4')。 例 如 , 求 [0, 324] 内 符合 条 件 的 数 , 设 答案 是 
ans, 计 算 步 又 如 下 : 

(1) 处 理 3 位 数 ,ans 二 ans 十 dp[3][0] 十 dp[3J[1] 十 dp[3J[2j], 得 到 000 一 099、100 一 
199、200 一 299 内 符合 条 件 的 个 数 。 

(2) 处 理 2 位 数 ,ans=ans 十 dp[2][o] 十 dpL2][L1] ,得 到 00 一 09、10 一 19 内 符合 条 件 的 
个 数 。 实 际 上 ,这 一 步 的 计算 对 应 的 是 300 一 309、310 一 319 。 

(3) 处 理 1 位 数 , 即 ans 王 ans 十 dpL1]Loj 十 dpL1]JL1] 十 dpL1]L2] 十 dpL1]L3]。 实 际 上 ， 
这 一 步 计 算 的 是 320.321、322、323、324。 

下 面 用 记忆 化 搜索 方法 重新 实现 上 述 思 路 。 
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2. 用 记忆 化 搜索 实现 hdu 2089 题 

回顾 记忆 化 搜索 ,其 思路 是 在 递归 程序 dfs() 中 搜索 所 有 可 能 的 情况 , 遇 到 已 经 算 过 的 
记录 在 dp[ ] 中 的 结果 就 直接 使 用 ,不 再 重复 计算 。 

例如 求 L0，324] 内 符合 条 件 的 数 , 记 忆 化 搜索 的 过 程 如 图 7. 25 所 示 。 其 中 面 线 部 分 是 
前 面 已 经 算 过 的 ,记录 在 dp[] 中 ,不 用 再 递归 和 重 算 。 


(000~099) 二 -~ 9) 


NO 
py Se 名 
(40~49)x 
(100~199) 
9 2 [EE 


(90~99) 

(200~299) ce 

(00~09) 
s > (0) 
(300~324) 一 一 =~ (10~19) 他 
20~24) 天 一 一 (2) 


G) 
6 ~ (4)x 


图 7.25 [0, 324] 的 记忆 化 搜索 过 程 


定义 dp[ 习 是 i 位 数 中 符合 要 求 的 数字 个 数 。dp[1] 表 示 符 合 条 件 的 1 位 数 ,0 是 1 位 
数 , 它 的 dpL1]=1; 1 也 是 1 位 数 , 它 的 dp[1] 沿 用 0 算 过 的 dp[1] 即 可 。dp[2] 表 示 符 合 条 
件 的 2 位 数 的 个 数 ,00 一 09 是 2 位 数 ,计算 得 到 dp[2]==9; 在 搜索 10 一 19 时 ,沿用 dpL2j 即 
可 。 同 理 ,(100 一 199) 和 (200 一 299) 都 沿用 (000 一 099) 的 计算 结果 dp[3], 不 用 再 计算 。 

dfs() 的 执行 过 程 如 下 : 从 输入 324 开始 ,一 直 递 归 到 最 深 处 的 (0) ,然后 逐步 回 退 ,计算 的 
顺序 是 (0) 一 (4) 一 (00 一 09) 一 (40 一 49) 一 (000 一 099) 一 (4) 一 (20 一 24) 一 (300 一 324) 一 
324, 图 7. 25 中 用 小 写 数字 标识 了 这 个 顺序 。 

记忆 化 搜索 极 大 地 减少 了 搜索 次 数 。 例 如 图 7. 25 中 检查 (000 一 099) ,因为 用 dp[] 进 
行 记 忆 化 搜索 ,只 需要 计算 5 次 ; 如 果 去 掉 记 忆 化 部 分 ,需要 递归 检查 每 个 数 , 共 100 次 。 

下 面 是 程序 ,程序 只 排除 了 数字 '4', 读 者 自己 练习 排除 "62"。 对 "62" 的 处 理 比较 复杂 ， 
需要 设计 新 的 dp[] 状 态 。 


#include < bits/stdc++.h> 
const int LEN = 12; 
int dp[ LEN]; //dp[i] :i 位 数 符合 要 求 的 个 数 .例如 dp[2] 表 示 00 一 99 内 符合 要 求 的 个 数 
int digit[LEN]; 
int dfs(int len, int ismax) { 
int ans = 0, maxx; 
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if(!len) return 1; // 已 经 递归 到 0 位 数 ,返回 
if(!ismax && dp[ len]!= -1) // 记 忆 化 搜索 :如 果 已 经 算 过 ,直接 使 用 
return dp[ len]; 
maxx = (ismax ? digit[len] : 9); 
for(int i=0; i<= maxx; i++) { 
if(i== 4) continue; // 排 除 4 
ans += dfs(len—1, ismax && i== maxx); 
if(!ismax) dp[len] = ans; 
return ans; 
} 
int main(){ 


int n, len = 0; 


memset(dp, —1, sizeof(dp)); // 初 始 化 为 -1 
scanf(" %d", gn); 
while(n) { 

digit[++len] = ns%10; 

n/=10; 


} 
printf(" % d\n", dfs(len,1)); 
return 0; 


【习题 】 


hdu 3555 题 : 求 [1, Nj] 里面 有 多 少数 包含 49',1<N<2% 一 1。 

hdu 3652 题 : B-number 是 一 个 非 负 整数 ,其 十 进 制 形式 包含 '13' 并 且 可 以 被 13 整除 。 
给 定 整 数 n,1 三 n 三 10 ,计算 1~n 的 B-number 数 。 

hdu 6148 题 : 计算 不 大 于 N 的 Valley Number 个 数 , 结 果 对 10" 十 7 取 模 。 此 题 较 难 。 

hdu 4507 题 : 计算 [L,R] 中 和 7 无 关 的 数字 的 平方 和 ,结果 对 10 十 7 取 模 。1 志 L 声 
R10 。 此 题 较 难 。 


7.6 状态 压缩 DP 


先 用 一 道 例题 引出 状态 压缩 DP 的 概念 。 
1. 例题 1 


poj 3254 “Corn Fields” 
农夫 约翰 有 一 片 长 方形 土地 , 划 成 M 行 N 列 的 方 格 。 他 准备 种 玉米 、 养 牛 , 不 过 有 
些 格子 很 贫 狂 ,不 适合 种 玉米 。 还 有 , 牛 不 喜欢 在 一 起 吃 , 所 以 牛 不 能 放 在 相 邻 的 格子 
里 。 给 出 这 块 地 的 情况 , 求 约 翰 有 多 少 个 种 玉米 的 方案 。 所 有 方 格 都 不 种 玉米 也 算 一 
种 方案 。 


。148 ， 


第 7 章 动态 规划 


输入 : 第 1 行 是 M 和 N ,1 三 M,N 三 12。 后 面 有 IM 行 ,描述 方 格 情况 ,1 表示 肥沃 ， 
0 表示 贫 痛 。 

输出 : 方案 数 , 用 10? 取 模 。 

输入 样 例 : 

2.3 

全 天 | 

010 

输出 样 例 : 

9 

提示 : 在 样 例 中 有 9 种 方案 。 


调 攻 局 式 ， 


4 


分 别 是 {}、{1)、{2)、{3)、{4}、{1,3}、{1,4}、{3,4}、{1,3,4}。 


这 个 方 格 图 共 m Xn 个 格子 ,有 2"*" 种 排列 ,无 法 用 暴力 法 计算 。 

用 下 面 的 方法 编程 计算 ,算法 复杂 度 是 O(mz2"2") 。 

1) 方 格 的 表示 

很 容易 想到 ,可 以 用 二 进 制 数 来 描述 方 格 ,1 表示 种 玉米 ,0 表示 不 种 玉米 。 在 样 例 中 ， 
第 1 行 的 3 个 方 格 都 是 肥沃 的 ,排除 相 邻 的 情况 ,有 以 下 5 种 种 玉米 的 方案 : 


编 号 1 2 3 4 5 
方 案 000 001 010 100 101 


第 1 行 


这 里 的 编号 并 不 是 多 余 的 ,在 下 面 设 计 DP 状态 的 时 候 有 用 。 

2) DP 状态 和 状态 转移 

如 何 设计 DP 状态 ,把 问题 从 小 规模 逐步 扩展 到 大 规模 ? 可 以 按 行进 行 扩展 。 
上 面 已 经 得 到 了 第 1 行 的 5 种 方案 ,下 面 继续 扩展 第 2 行 。 

在 样 例 中 ,第 2 行 只 有 两 种 方案 , 即 000、010。 


编 号 L 2 
方 案 000 010 


第 2 行 


如 果 第 2 行 选编 号 1 的 000. 第 1 行 可 以 选 5 种 方案 而 不 冲突 。 

如 果 第 2 行 选编 号 2 的 010, 与 第 1 行 的 010 有 冲突 ,第 1 行 的 其 他 4 种 方案 没 问 题 。 

共 5 十 4 一 9 种 方案 。 

用 dp[ 避 [7] 表示 第 i 行 采用 第 j 种 编号 的 方案 时 前 i 行 可 以 得 到 的 可 行 方案 总 数 。 例 
如 ,dp[2][L2]=4 表示 第 2 行使 用 第 2 种 方案 ( 即 010) 时 的 方案 总 数 是 4。 

从 第 i 一 1 行 转移 到 第 i 行 ,状态 转移 方程 如 下 : 
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dp[ij[*j] = 2 dp[i— 1 
其 中 j 是 第 i 一 1 行 可 行 方案 的 编号 ,而 且 所 有 的 dp[i 一 1j[j] 与 第 i 行 不 冲突 。 
把 最 后 一 行 的 dp[mj[kj(1k 志 nn) 相 加 就 得 到 了 管 案 。 
3) 一 些 细节 
程序 有 很 多 细节 ,例如 初始 化 每 一 行 的 合法 方案 , 即 找 没有 相 邻 1 的 二 进 制 数 。 用 
state[] 表 示 方 案 , 例 如 样 例 的 第 1 行 state[2]==010; 表示 只 种 中 间 一 块 地 。 可 以 这 样 写 程序 : 


int state[ 600]; //state[x]: 编 号 x 的 方案 是 state[x] 
bool check( int x){ // 判 断 x 的 二 进 制 数 是 否 有 相 邻 的 1 
证 (x&x<<1)return false; //x 有 相 邻 的 1, 该 方案 不 合法 
else return true; //x 没 有 相 邻 的 1, 合法 
上 
void init(){ // 初 始 化 合法 的 方案 
intj = 0; 
int total = 1 <<N; // 一 行 有 N 个 格子 ,有 2x 种 情况 
for(int i = 0; i< total; ++i) 
if(check(i)) state[++j] = i; // 记 录 合 法 方案 


} 


对 于 相 邻 两 行 的 合法 性 判断 ,这 样 写 程序 : 
if(state[i] & state[j] != 1) .… // 相 邻 的 两 行 ,没有 挨 着 的 1 


2. 状态 压缩 DP 的 概念 

从 上 面 的 例子 可 以 看 出 ,每 个 状态 dp[ 门 [ 门 表示 的 不 是 一 个 有 意义 的 数值 ,例如 前 面 
章节 中 的 花费 、 价 值 \ 长 度 等 ,而 是 代表 了 集合 的 数量 。 这 种 处 理 复 杂 集合 问题 的 DP 叫做 
状态 压缩 DP。 

集合 的 状态 有 很 多 ,操作 复杂 ,往往 把 方案 用 二 进 制 数 (“ 压 缩 * 到 这 个 二 进 制 数 中 ) 来 表 
示 和 操作 。 二 进 制 操作 有 与 、 或 , 取 反 、 移 位 等 。 在 上 面 的 例子 中 ,把 可 能 的 方案 “压缩 到 
state[] 中 ,操作 用 到 了 左 移 。 

3. 旅行 商 问题 

旅行 商 问题 (Traveling Salesman Problem,TSP) 是 一 个 经 典 问题 : 及 n 
个 城市 ,已 知 任何 两 个 城市 之 间 的 距离 (或 者 费用 ) ,一 个 旅行 商 从 某 城 市 出 “H 人 
发 ,经 过 每 一 个 城市 并 且 只 经 过 一 次 ,最 后 回 到 出 发 的 城市 ,输出 最 短 (或 者 路 OO 
费 最 少 ) 的 线路 。 

TSP 问题 是 NP 难度 的 ,没有 多 项 式 时 间 的 高 效 算法 ,所 以 TSP 题目 给 的 n 都 很 小 。 
如 果 用 暴力 法 ,可 以 列 出 所 有 的 路 线 , 然 后 逐一 判断 。 路 线 最 多 可 能 有 (zz 一 1)! 种 ,只 能 用 
于 解决 规模 ”和 11 的 问题 。 如 果 题 目 不 需 要 求 最 短 的 线路 ,可 以 用 贪心 法 求 近似 解 , 找 出 一 
条 可 行 的 .比较 短 的 路 线 。 

小 规模 的 TSP 问题 可 以 用 状态 压缩 DP 求解 ,复杂 度 是 O(2”n?) ,能 解决 规模 nn 二 15 的 
问题 , 比 暴力 的 O(n1) 好 一 些 。 思 路 如 下 : 

假设 最 短 的 TSP 路 径 是 Path== (ww 一 说 一 oa 一 oo) 
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那么 Path==(w 一 vw) 十 (wi 一 ve 一 v3 一 vo) 

所 以 ,问题 转变 为 : 求 经 过 所 有 城市 的 最 短 回路 一 从 某 个 城市 到 起 点 的 最 短路 径 。 

DP 状态 设计 如 下 : 假设 已 经 访问 过 的 城市 集合 是 S, 当前 所 在 城市 是 ,用 dp[SJ[w] 
表示 从 v 出 发 访问 剩余 的 所 有 城市 最 后 回 到 起 点 的 路 径 费 用 总 和 的 最 小 值 。 状 态 转移 方程 
如 下 : 

dpLV][o]=0 //V 是 最 后 一 个 城市 
dp[SJ[v]=min(dp[SU {u} J[u]jt+dist(v,w) |u$ S} 

城市 集合 S 如 何 表示 ? 这 就 用 到 状态 压缩 DP 的 技巧 : 把 路 径 * 压 缩 * 到 一 个 二 进 制 数 

中 。 定 义 : 


int dp[ 1 << MAXN][MAXN]; 


MAXN 是 城市 数量 , 当 MAXN==15 时 ,1 << MAXN 一 25 一 32 768,0 一 32 768 内 的 每 
个 数 的 二 进 制 表示 就 是 一 个 可 能 的 路 径 , 二 进 制 数 中 的 1 表示 选中 一 个 城市 ,0 表示 不 选 
中 。 例 如 S=000 0000 0000 0101。 ,末尾 的 101 表示 已 访问 过 城市 2.0。 在 下 面 的 代码 中 ， 
“dp[s|11<<uj[uj”, 其 中 的 s11 <<u, 表 示 在 已 访问 过 的 城市 集合 S 中 加 入 一 个 新 访问 的 城 


Di 


下 面 是 部 分 示意 代码 ?。 


int dp[ 1 << MAXN][MAXN]; 
void solve(){ 
memset(dp, INF, sizeof(dp)); // 初 始 化 为 无 穷 大 
dp[(1<<n) -1][0] = 0; // 从 最 后 一 个 点 出 发 到 起 点 0, 已 经 没有 城市 可 
// 以 走 , 所 以 到 起 点 0 的 最 小 路 径 费 用 是 0 
for (ints = (1<<n) - 2; s>=0; s--) //0(2°) 
for(int v= 0; v<n; v++) //o(n) 
for(int u= 0; u<n; ut+) //0(n) 
if(!(s>>u&l)) 
dp[s][v] = min(dp[s][v], dp[sl1 <<u][u] + dist[v][u]); 
printf(" % d\n", dp[ 0][0]); 
} 


4. 例题 2 
这 一 题 是 TSP 的 变形 。 


hdu 3001 “Travelling” 
Acmer 先生 决定 访问 nn 座 城市 。 他 可 以 空降 到 任意 城市 ,然后 开始 访问 ,要 求 访问 
到 所 有 城市 ,任何 一 个 城市 访问 的 次 数 不 少 于 1 次 ,不 多 于 2 次 。nn 座 城市 间 有 m 条 道 
路 ,每 条 道路 都 有 路 费 。 求 Acmer 先生 完成 旅行 需要 花费 的 最 小 费用 。 
输入 : 第 1 行 是 n 和 m,1 三 n 三 10; 后 面 有 m 行 ,有 3 个 整数 a.b.c, 表 示 城 市 a 和， 
之 间 的 路 费 是 c。 
输出 : 最 少 花费, 如果 不 能 完成 旅行 , 则 输出 一 1。 
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本 题 x“ 一 10, 数 据 很 小 ,但 是 由 于 每 个 城市 可 以 走 两 遍 , 可 能 的 路 线 就 变 成 了 (2z)1!1, 所 
以 不 能 用 暴力 法 。 

本 题 用 状态 压缩 DP 求解 ,算法 复杂 度 是 0(3"z?) , 当 一 10 时 正好 通过 OJ 测试 。 

1) 路 径 的 表示 

在 普通 TSP 中 ,一 个 城市 具有 两 种 情况 , 即 访问 和 不 访问 ,用 1 和 0 表示。 这 个 题 有 
3 种 情况 ,也 就 是 不 访问 访问 1 次 ,访问 2 次 ,所 以 需要 用 到 三 进 制 。 

当 n==10 时 有 3" 种 组 合 ( 路 径 数量 ) ,对 每 种 路 径 用 三 进 制 表 示 。 例 如 ,第 14 种 路 径 ， 
它 的 三 进 制 是 112; ,表示 第 3 个 城市 走 1 次 ,第 2 个 城市 走 1 次 ,第 1 个 城市 走 2 次 。 

在 程序 中 用 tri[ 门 [表示 第 i 个 路 径 ,其 第 j 位 的 值 是 城市 状态 ,例如 triL14][3]=1， 
tri[14][2]=1,tri[14J[1j]=2。 

2) 状态 和 状态 转移 

定义 状态 dp[ 站 [站 ,当前 所 在 城市 是 i,dp[ 门 [ 门 表示 从 i 出 发 访问 剩余 的 所 有 城市 最 
后 回 到 起 点 的 路 径 费用 总 和 的 最 小 值 。 

状态 转移 : dp[j][i] 二 min(dp[j][i], dp[kj[1] 十 graph[kj[j]); 


#include < bits/stdc++.h> 
const int INF = Ox3f3f3f3f; 
using namespace std; 
int n,m; 
int bit[12] = {0,1,3,9,27,81,243,729,2187,6561, 19683, 59049}; 
// 三 进 制 每 一 位 的 权 值 ,与 二 进 制 的 0、.1、2、4、8 等 对 昭 
int tri[60000][11]; 
int dp[11][60000]; 


int graph[11][11]; // 存 图 
void make_trb(){ // 初 始 化 , 求 所 有 可 能 的 路 径 
for(int i=0;i<59050;++i){ // 共 3^10=59 050 种 状态 
int t=i; 
for(int j=1; j<=10; ++j){tri[i][j] =t%3; t/=3;} 
’ 


| 

int comp_dp(){ 
int ans = INF; 
memset(dp, INF, sizeof(dp)); 
for(int i=0;i<=n;i+t+) 


dp[i][bit[i]]=0; //bit[i] 是 第 i 个 城市 ,起 点 是 任意 的 
for(int i=0;i<bit[n+1];i++){ 
int flag= 1; // 所 有 的 城市 都 遍历 过 1 次 以 上 
for(int j=1;j<=n;j++){ // 选 一 个 终点 
if(tri[i][j] == 0){ // 判 断 终点 位 是 否 为 0 
flag= 0; // 还 没有 经 过 所 有 点 
continue; 


} 

if(i==j) continue; 

for(int k=1; k<=n; k++){ 
int 1=i- bit[j]; //i 状态 的 第 j 位 置 0 
证 (tri[i][k] == 0) continue; 
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dp[j][i] =min(dp[j][il], dp[k][1] + graph[k][j]); 
3 
} 
if(flag) // 找 最 小 费用 
for(int j=1; j<=n; j++) 
ans = min(ans, dp[j][i]); 
} 
return ans; 
} 
int main(){ 
make_ trb(); 
while(cin>n>>m){ 
memset (graph, INF, sizeof (graph) ); 
while(m—— ){ 
int a,b,c; 
cin>>a>b>ce; 
if(c<graph[a][b]) graph[a][b] = graph[b][a]=¢; 
} 
int ans = comp_dp(); 
if(ans == INF) cout <<" — 1"<< endl; 
else cout << ans << endl; 
} 


return 0; 


【习题 】 


hdu 1074“Doing Homework”, 入门 题 。 

hdu 2167 “Pebbles”。 

hdu 3182 “Hamburger Magi”。 

hdu 4539“ 排 兵 布 阵 ”。 

poj 1185“ 炮 兵 阵地 ”, 经 典 题 。 

poj 2411“Mondriaan's Dream”, 铺 砖 问题 。 
hdu 3681“Prison Break”,TSP 十 二 分 ,难题 。 


7.7 水 结 


本 章 介 绍 了 常见 的 DP 算法 。 读 者 已 经 看 到 ,DP 题目 不 仅 涉及 大 量 知 识 点 ,而 且 思 维 
灵活 ,不 容易 掌握 。DP 题目 作为 竞赛 的 必 考 题 型 ,参赛 者 需要 花 大 量 时 间 练 习 , 掌 握 其 中 
的 诀 穿 。 

另外 还 有 很 多 可 用 DP 的 算法 在 本 章 没 有 涉及 ,例如 用 DP 解决 以 概率 为 最 优 解 的 问 
题 , 具 体内 容 见 本 书 8.4 节 ; 还 有 AC 自动 机 十 DP、 后 级 自动 机 十 DP 等 。 
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所 高 精度 计算 

如 数论 

所 组 合 数学 

茹 概率 和 数学 期 望 

悟 公平 组 合 游戏 

数学 题 在 算法 竞赛 中 经 常 出 现 。 数 学 题 的 知识 点 相当 广 , 有 些 容 易 理解 ,有 些 比较 难 。 
在 竞赛 中 经 常 把 数学 模型 和 其 他 算法 结合 起 来 ,出 综合 性 的 题目 ,所 以 本 书 把 数学 题 相关 内 
容 放 在 比较 靠 后 的 章节 


常见 的 数学 方面 的 题目 包括 数论 .组合 数 学 .概率 和 数学 期 望 ` 组 合 游戏 等 大 类 ,这 里 先 
列 出 常见 的 知识 点 ,本 章 将 讲解 其 中 部 分 内 容 。 

(1) 数论 。 

整除 性 问题 : 整除 .最 大 公约 数 、 最 大 公 售 数 ; 欧 几 里 得 算法 、 扩 展 欧 几 里 得 算法 。 

素数 问题 : 素数 判定 `. 区 间 素 数 统计 。 

同 余 问 题 : 模 运 算 、 同 余 方程 ,快速 血 、 中 国 剩余 定理 、 逆 元 ,整数 分 解 , 同 余 定理 。 

不 定 方 程 。 

乘 性 函数 : 欧 拉 函 数 、 伪 随机 数 、 莫 比 乌 斯 反 演 。 

(2) 组 合 数 学 。 

排列 组 合 : 计数 原理 ,特殊 排列 .排列 生成 、 组 合生 成 。 

母 函数 : 普通 型 .指数 型 。 

递 推 关 系 : Fibonacci 数列 、Stirling 数 、Catalan 数 。 

容 斥 原理 、 铝 人 巢 原 理 。 

群 : Polya 定理 。 

线性 规划 : 单纯 形 法 。 

(3) 矩阵 、 线 性 代数 .高 精度 计算 、 概 率 和 数学 期 望 组合 游戏 、 傅 里 叶 变换 。 


8.1 高 精度 计算 


高 精度 计算 ,是 指 参 与 运算 的 数 大 大 超出 了 标准 数据 类 型 所 能 表示 的 范 视频 讲 和 
围 的 运算 ,例如 两 个 1000 位 数 相 乘 。 这 类 题目 在 算法 竞赛 中 的 出 现 很 频繁 。 
在 C 或 者 C++ 中 ,最 大 的 数据 类 型 只 有 64 位 ,如 果 需 要 处 理 更 大 的 数 ,只 能 用 数组 来 模 


拟 , 把 大 数 的 每 一 位 存储 在 数组 中 ,然后 按 位 处 理 进位 、 借 位 问题 ,相当 麻烦 。 

但 是 用 Java 处 理 高 精度 非常 简单 ,可 以 直接 计算 。 在 Java 中 有 两 个 类 一 一 BigInteger 
和 BigDecimal, 分 别 表 示 大 整数 类 和 大 浮 点 数 类 ,两 个 类 的 对 象 能 处 理 的 数理 论 上 能 够 表示 
无 限 大 ,只 要 计算 机 内 存 足 够 大 。 这 两 个 类 都 在 java. math. * 包 中 。 

例如 hdu 1042 题 , 输 入 整数 N(0 过 N10 000) ,输出 N!。 当 N=10 000 时 ,N! 是 一 
个 超级 大 的 数字 。 读 者 可 以 尝试 用 C++ 实现 9。 用 Java 可 以 直接 算 ,下面 是 代码 。 


hdu 1042 题 的 Java 代码 


import java. math. BigInteger; 
import java. util. *; 
public class Main{ 
public static void main(String[] args) { 
Scanner input = new Scanner(System. in); 
while(input. hasNext()) { 
int n = input. nextInt(); 
BigInteger ans = BigInteger.ONE; 
for(int i = 1; i<=n; i++) 
ans = ans.multiply(BigInteger. valueOf(i)); 
System. out. println(ans); 
} 
} 
' 


Java 虽然 能 处 理 大 数 , 但 是 对 于 规模 过 大 的 问题 用 Java 也 不 能 做 。 例 如 hdu 1061 题 ， 
2 一 10? , 求 刀 。 此 时 需要 一 些 特 殊 的 算法 ,例如 "快速 寡 ”, 见 下 一 节 内 容 。 


【习题 】 


请 读者 自己 找 资 料 熟 悉 Java 的 高 精度 运算 ,并 通过 以 下 习题 掌握 用 法 。 
hdu 1047, 求 和 。 

hdu 1063, 实 数 的 高 精度 短 。 

hdu 1316 ,大 数 比 较 。 

hdu 5666 ,大 数 除法 。 

hdu 5686 ,大 数 递 推 。 


8.2 数 论 


数论 是 研究 整数 性 质 的 数学 分 支 。 初 等 数论 的 主要 内 容 有 整除 问题 素数 不 定 方程 、 
同 余 问题 . 乘 性 函数 等 。 本 节 介 绍 竞赛 中 常用 的 一 些 初等 数论 知识 。 


外 用 “万 进 制 * 可 以 求解 x! ,请 读者 搜索 网 上 资料 。 
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8.2.1 模 运算 


模 运 算是 大 数 运算 中 的 常用 操作 。 如 果 一 个 数 太 大 ,无 法 直接 输出 ,或 者 不 需要 直接 输 
出 ,可 以 把 它 取 模 后 缩小 数值 再 输出 。 

定义 取 模 运算 为 a 除 以 m 的 余数 了 , 记 为 : 

a modm=a %m 

取 模 的 结果 满足 0 三 a mod m 三 m 一 1, 题 目 用 给 定 的 m 限制 计算 结果 的 范围 。 例 如 
m 二 10, 就 是 取 计 算 结 果 的 个 位 数 ,参考 hdu 1061 题 , 求 w* ,n 二 10 ,输出 结果 的 个 位 数 。 

取 模 操作 满足 以 下 性 质 。 

加 : (a+b)mod m=((a mod m)++(b mod m))mod m 

减 ; (a 一 PD)mod m=((a mod m)—(b mod m))mod m 

乘 : (aXb)mod m=((a mod m) X (b mod m))mod m 

然而 ,对 除法 取 模 进行 下 面 的 类 似 操作 是 错误 的 : 

(a/PD)mod m=((a mod m)/(b mod m))mod m 
例如 ,(100/50)mod 20 王 2,(100 mod 20)/(50 mod 20)mod 20 王 0, 两 者 不 相等 。 
除法 的 取 模 需要 用 到 道 元 ,将 在 * 同 余 与 道 元 ?这 一 节 中 介绍 。 


8.2.2 ”快速 究 
1. 快速 界 概 念 


快速 究 以 及 扩展 的 矩阵 快速 答 , 由 于 应 用 场景 比较 常见 ,也 是 竞赛 中 常见 的 题 型 。 

宪 运 算 a" 即 n 个 a 相 乘 。 快速 究 就 是 高 效 地 算出 a"。 当 很 大 时 ,例如 ==10 ,计算 a" 
这 样 大 的 数 Java 也 不 能 处 理 , 一 是 数字 太 大 ,二 是 计算 时 间 很 长 。 下 面 先 考虑 如 何 缩短 计算 
时 间 ,如 果 用 暴力 的 方法 直接 算 a” , 即 逐 个 做 乘法 ,复杂 度 是 O(n) ,即使 能 算出 来 ,也 会 超时 。 

读者 很 容易 想到 快速 短 的 办 法 : 先 算 a? ,然后 继续 算 平方 (a*)? ,一 直 算 到 ) 次 宕 。 这 
是 分 治 法 的 思想 ,复杂 度 为 O(logsn)。 下 面 是 代码 ,请 读者 自己 理解 : 


int fastPow( int a, int n){ 


if(n == 1) returna; 

int temp = fastPow(a, n/2); // 分 治 

if(n%2 == 1) // 奇 数 个 a, 此 处 也 可 以 写 为 if(n &1) 
return temp * temp * a; 

else // 偶 数 个 a 


return temp * temp; 


} 


程序 中 的 递归 , 层 数 只 有 log:z ,不 用 担心 溢出 的 问题 。 
上 面 的 程序 非常 好 ,不 过 还 有 一 种 更 好 的 方法 ,是 用 位 运算 做 快速 竹 , 时 间 复 杂 度 也 是 
O(logzz) 。 下 面 以 oa 为 例 说 明快 速 寡 的 原理 。 


外 ”注意 ,此 时 要 求 a 和 wm 的 正 负 号 一 致 ,都 为 正 数 或 都 为 负数 。 如 果 正 负 不 同 , 取 模 和 求 余 的 结果 是 不 同 的 。 
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先 把 oa 分 解 成 as .az .a! 的 乘积 , 即 a 二 as*?11 一 as Xa?X al。 

如 何 求 es .a? \al 的 值 ,需要 分 别 计算 吗 ? 并 不 需要 。 用 户 可 以 容易 地 发 现 ,alX 吧 一 
a Xa 二 a! ,a Xa 一 a’, 等 等 ,都 是 2 的 倍数 ,产生 的 a 都 是 倍 乘 关 系 , 逐 级 递 推 就 可 以 
了 。 在 下 面 的 程序 中 ,这 个 功能 用 “base * 一 base; "实现 。 

那么 如 何 把 分解 成 11 二 8 十 2 十 1 这 样 的 倍 乘 关 系 ? 用 二 进 制 就 能 理解 了 。 把 n 转 为 
二 进 制 数 ,二 进 制 数 中 每 一 位 的 权 值 都 是 低 一 位 的 两 们 ,对 应 的 w 是 倍 乘 的 关系 ,例如 "一 
11w 二 1011; 二 2 十 2: 十 2 二 8 十 2 十 1, 所 以 上 只 需 要 把 n 按 二 进 制 处 理 就 可 以 了 。 

另外 还 有 一 个 需要 处 理 的 问题 : 如 何 跳 过 那些 不 需要 的 ?例如 求 a ,因为 11==8 十 2 十 
1, 需 要 跳 过 a*。 这 里 做 个 判断 即 可 ,1011 中 的 0 就 是 需要 跳 过 的 。 这 个 判断 ,利用 二 进 制 
的 位 运算 很 容易 实现 : 

(1) n& 1, 取 nn 的 最 后 一 位 ,并 且 判 断 这 一 位 是 否 需 要 跳 过 。 

(2) n>>=1, 把 nn 布 移 一 位 ,目的 是 把 刚 处 理 过 的 的 最 后 一 位 去 掉 。 


int fastPow( int a, int n){ 


int base = a; // 不 定义 base, 直接 用 a 进行 计算 也 行 
int res = 1; // 用 res 返回 结果 
while(n) { 
if(n &1) // 如 果 n 的 最 后 一 位 是 1, 表 示 这 个 地 方 需要 乘 
res * = base; 
base * = base; // 推 算 乘 积 ,a? --> a -->a? --> al5… 
n>=1; //n 右 移 一 位 ,把 刚 处 理 过 的 n 的 最 后 一 位 去 掉 
} 
return res; 


: 


对 照 上 面 的 程序 ,执行 步骤 如 表 8. 1 所 示 。 


表 8.1 执行 步骤 
n res(res* = base) base(base * = base) 

第 1 轮 1011 Ql Q2 

第 2 轮 101 al Xa’ as 

第 3 轮 10 是 0,res 不 变 寺 

第 4 轮 1 a Xa Xas a 

结束 0 

2. 快速 申 取 模 


由 于 竹 运 算 的 结果 非常 大 ,常常 会 超过 变量 类 型 的 最 大 值 .甚至 超过 内 存 所 能 存放 的 最 
大 数 , 所 以 涉及 快速 蜂 的 题目 ,通常 都 要 做 取 模 操作 ,缩小 结果 。 
根据 模 运 算 的 性 质 ,在 快速 竹中 做 取 模 操作 ,对 a” 取 模 ,和 先 对 a 取 模 再 做 寡 运 算 的 结 
果 是 一 样 的 , 即 : 
a” mod m= (a mod m)” mod m 


下 面 修改 位 运算 fastPow( 函 数 ,加 上 取 模 操作 。 以 hdu 2817 题 为 例 , 取 模 操作 如 下 : 


const int mod = 200907; 


二 
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if(n&l) 
res = (base * res) % mod; 
base = (base * base) % mod; 


对 于 分 治 法 fastPow() 函 数 的 取 模 操作 ,请 读者 自己 做 类 似 的 修改 。 
3. 矩阵 快速 早 
给 定 一 个 mXm 的 矩阵 A , 求 它 的 半 次 宕 4" ,这 也 是 常见 的 计算 。 同 样 有 矩阵 快速 寡 


的 算法 ,原理 是 把 矩阵 当 作 变量 来 操作 ,程序 和 上 面 的 很 相似 。 


首先 需要 定义 矩阵 的 结构 体 , 并 且 定 义 矩 阵 相 乘 的 操作 。 注 意 矩 阵 相 乘 也 需要 取 模 。 


const int MAXN = 2; // 根 据 题目 要 求 定义 矩阵 的 阶 , 本 例 中 是 2 
const int MOD = le4; // 根 据 题目 要 求 定义 模 
struct Matrix{ // 定 义 和 矩阵 

int m[ MAXN] [MAXN]; 

Matrix() { 


memset(m, 0, sizeof(m)); 
} 
}; 
Matrix Multi(Matrix a, Matrix b) { // 和 矩阵 的 乘法 
Matrix res; 
for(int i=0; i<MAXN; i++) 
for(int j= 0; j<MAXN; j++) 
for(int k=0; k<MAXN; k++) 
res.m[i][j] = (res.m[i][j] + a.m[i][k] * b.m[k][j]) % MOD; 
return res; 


: 


下 面 是 矩阵 快速 备 的 程序 代码 ,和 前 面 单 变量 的 快速 备 的 代码 非常 相似 。 


Matrix fastm(Matrix a, int n){ 
Matrix res; 
for(int i=0; i<MAXN; i++) 
// 初 始 化 为 单位 矩阵 ,相当 于 前 面 程序 中 的 "int res = 1;" 
res.m[i][i] = 1; 
while(n) { 
if(n&1) 
res = Multi(res, a); 
a = Multi(a, a); 
n>=1; 
} 
return res; 


} 


矩阵 快速 震 的 复杂 度 : 上 面 求 A",A 是 m Xm 的 方 阵 ,其 中 和 矩阵 乘法 的 复杂 度 是 


OGm) ,快速 短 的 复杂 度 是 O(logzn) , 合 起 来 是 OCm’logzn)。 


应 用 和 抢 阵 快速 索 的 难点 在 于 如 何 把 递 推 关 系 转换 为 矩阵 。 
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【习题 】 


hdu 2817。 

hdu 1061, 求 痉 的 末尾 数字 .n 二 10?。 

hdu 5392 ,快速 寡 取 模 _LCM。 

poj 3070、hdu 3117。 和 矩阵 快速 索 的 经 典 题目 , 算 Fibonacci 数列 。 求 第 10 个 Fibonacci 
数 ,因为 直接 递 推 无 法 完成 ,所 以 先 用 和 矩阵 表示 Fibonacci 数列 的 递 推 关 系 , 然 后 把 问题 转换 
为 求 这 个 矩阵 的 10" 寡 。 

hdu 6030 ,把 递 推 关系 转换 为 矩阵 。 

hdu 5895, 有 难度 的 矩阵 快速 霸 。 

hdu 5564, 数 位 DP、 和 矩阵 快速 短 。 

hdu 2243,AC 自动 机 ,矩阵 快速 寡 。 


8.2.3 GCD、LCM 

最 大 公约 数 GCD 和 最 小 公 倍数 LCM 是 竞赛 中 常见 的 知识 点 ,虽然 这 两 个 知识 点 很 容 
易 理解 ,但 往往 会 与 其 他 知识 点 结合 起 来 出 综合 题 ,并 不 容易 。 

1. 最 大 公约 数 GCD 


整数 a 和 2 的 最 大 公约 数 记 为 gcd(a,b)。 在 编程 时 有 两 种 做 法 。 
(1) 经 典 的 欧 几 里 得 算法 ,用 加 转 相 除法 求 最 大 公约 数 ,模板 如 下 : 


int gcd(int a, int b) { 
returnb == 0?a: gcd(b, a%b); 
} 


时 间 复 杂 度 差不多 是 O(logsn) 的 ?, 非 常 快 。 
(2) 或 者 直接 用 C++ 的 内 置 函 数 求 GCD: 


std::__gcd(a, b) 
2. 最 小 公 倍 数 LCM 
整数 a 和 2 的 最 小 公 倍数 记 为 cm(a ,0) ,模板 如 下 : 


int lcm(int a, int b) { 
return a/gcd(a, b) * b; 
} 


8.2.4 扩展 欧 几 里 得 算法 与 二 元 一 次 方程 的 整数 解 


读者 可 能 还 记得 中 学 接触 过 的 一 个 问题 : 给 出 整数 a、bn, 间 方程 az 十 by 二 n 什么 时 


@ 严格 的 复杂 度 分 析 参 考 ( 初 等 数论 及 其 应 用 ) 第 6 版 ,Kenneth H. Rosen 著 , 夏 鸿 刚 译 ,机 械 出 版 社 ,3.4 节 的 欧 
几 里 得 算法 。 
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候 有 整数 解 ? 如 何 求 所 有 的 整数 解 ? 
有 解 的 充分 必要 条 件 是 gcd(a,5) 可 以 整除 n。 简 单 解释 如 下 : 
邻 a=gcd(a,ba’ .6 二 gcd(a,6)b', 有 azx 二 by 二 gcd(a,b)(ar 十 b'y) 二 n; 如 果 z ya 、 
4b 都 是 整数 ,那么 n 必须 是 ged(a,5) 的 倍数 才 有 整数 解 。 
例如 4z 十 6y 二 8、2z 十 3y 二 4 有 整数 解 ,4z 十 6y 一 7 则 没有 整数 解 。 
如 果 确 定 有 人 解 ,一 种 解 题 方法 是 先 找到 一 个 解 (zo ,yo) ,那么 通 解 公式 如 下 : 
工 一 To 十 8 
y 二 yo 一 at，t 是 任意 整数 
所 以 ,问题 转化 为 如 何 求 (zo ,yo)。 利 用 扩展 欧 几 里 得 算法 可 以 求 出 这 个 特 解 。 
1. 扩展 欧 几 里 得 算法 
当 方 程 符合 az 十 by 二 gcd(a,5b) 时 ,可 以 用 扩展 欧 几 里 得 算法 求 (z。 ,yo)。 程 序 如 下 


void extend_gcd( int ay int b, int gx, int &y){ // 返 回 x,y, 即 一 个 特 解 (xo ,yo) 
if(b==0) { 
x=1, y=0; 
return; 
} 
extend gcd(b, a% b, x, y); 
int tmp = x; 
x=y; 
y= tmp - (a/b)*xy; 
i 


有 时 候 为 了 简化 描述 ,在 az 十 by 二 gcd(a,5) 两 边 除 以 gcd(a,6) ,得 到 cx 十 dy 二 1, 其 中 
Cc 三 a/gcd(c,6),d 二 b/gcd(a,6b)。 很 明显 ,cd 是 互 质 的 。czx 十 dy 二 1 的 通 解 如 下 : 
X=Zzot+dt 
y 二 yo 一 Gt， 是 任意 整数 
2. 求 任意 方程 ax 十 by==n 的 一 个 整数 解 
用 扩展 欧 几 里 得 算法 求解 az 十 by 二 gcd(a.5) 后 ,利用 它 可 以 进一步 解 任意 方程 wz 十 
by 二 n, 得 到 一 个 整数 解 。 其 步骤 如 下 : 
(1) 判断 方程 az 十 by 二 n 是 否 有 整数 解 , 有 和 解 的 条 件 是 gcd(e ,0 可 以 整除 w; 
(2) 用 扩展 欧 几 里 得 算法 求 cz 十 by 一 gcd(a,0) 的 一 个 解 (zo ,yo); 
(3) 在 azo 十 bxyo 一 gcd(a,0) 两 边 同 时 乘 以 zw/gcd(a,o) ,得 : 
azron/gcd(a.b) + byon/gcd(a.b) =n 
(4) 对 照 cz 十 by 一 7 得 到 它 的 一 个 解 (zl ,yl) 是 : 
2 一 zon/gcd(a,b) 
6 一 yon/gcd(a.b) 
3. 应 用 场合 
扩展 欧 几 里 得 算法 是 一 个 很 有 用 的 工具 ,在 竞赛 题目 中 常用 于 以 下 场合 : 


@@ 程序 的 执行 过 程 参考 (算法 导论 ),Thomas H. Cormen 等 著 ,机 械 工业 出 版 社 ,31.2 节 。 
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(1) 求解 不 定 方程 ; 

(2) 求解 模 的 逆 元 ; 

(3) 求解 同 余 方程 。 

虽然 用 扩展 欧 几 里 得 算法 可 以 算 az 十 by 二 gcd(a,5) 的 通 解 ,不 过 一 般 没 有 这 个 需求 ， 
而 是 用 于 求 某 些 特殊 的 解 , 例 如 求解 逆 元 , 逆 元 是 除法 取 模 操作 常用 的 工具 。 


【习题 】 


poj 1061, 扩 展 欧 几 里 得 。 
hdu 1019,LCM., 

hdu 1576, 扩 展 欧 几 里 得 。 
hdu 2504,GCD, 水 题 。 
hdu 2588,GCD, 欧 拉 函 数 。 
hdu 5223,GCD, 贪 心 。 

hdu 5584,LCM., 

hdu 5656,GCD,DP。 

hdu 5902,GCD, 暴 力 。 


8.2.5 同 余 与 逆 元 


同 余 在 数论 中 非常 有 用 , 它 用 类 似 处 理 等 式 的 方式 来 处 理 整除 关系 ,非常 简便 。 

1. 同 余 

两 个 整数 a、b 和 一 个 正 整 数 m ,如果 a 除 以 m 所 得 的 余数 和 2 除 以 m 所 得 的 余数 相 
等 , 即 a mod mm 一 mod m, 称 a 和 6b 对 于 m 同 余 ?,m 称 为 同 余 的 模 。 同 余 的 概念 也 可 以 这 
样 理解 : m| (a 一 5), 即 a 一 b 是 m 的 整数 倍 。 例 如 61(23 一 5) ,23 和 5 对 模 6 同 余 。 

同 余 的 符号 记 为 a 三 b(mod m)。 

2. 一 元 线性 同 余 方 程 

aZz 三 b(mod m), 即 az 除 以 ma.,b 除 以 m, 两 者 余数 相同 ,这 里 a、b、m 都 是 整数 ,求解 x 
的 值 。 

方程 也 可 以 这 样 理解 : ax 一 5b 是 m 的 整数 倍 。 设 y 是 倍数 ,那么 ax 一 6 二 my, 移 项 得 到 
azx 一 my 一 b。 因 为 y 可 以 是 负数 ,改写 为 ar 十 my 二 0, 这 就 是 在 扩展 欧 几 里 得 算法 中 提 到 的 
二 元 一 次 不 定 方程 。 

当 且 仅 当 gcd(a,m) 能 整除 5 时 有 整数 解 。 例 如 15z 十 6y 二 9, 有 整数 解 zx 一 1,y 一 一 1。 

当 gcd(a,m) 二 6b 时 ,可 以 直接 用 扩展 欧 几 里 得 算法 求解 cz 十 my 一 0。 

如 果 不 满足 gcd(a ,zz) 一 0, 还 能 用 扩展 欧 几 里 得 算法 求解 at 十 my 二 5b 吗 ? 答案 是 肯定 
的 ,但 是 需要 结合 下 面 的 逆 元 。 

3. 逆 元 

给 出 a 和 xm, 求解 方程 az 二 1(mod m), 即 az 除 以 m 余数 是 1 。 


@ 《初等 数论 及 其 应 用 ) 第 6 版 ,Kenneth H. Rosen 著 , 夏 鸿 刚 译 ,机 械 工业 出 版 社 ,第 4 章 “ 同 余 ”。 
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根据 前 面 的 讨论 ,有 解 的 条 件 是 gcd(a,m) 二 1, 即 a、m 互 素 。 该 问题 等 价 于 求解 cz 十 
my 二 1, 可 以 用 上 一 节 的 扩展 欧 几 里 得 算法 求解 。 例 如 8z 圭 1(mod 31) ,等 价 于 求解 8z 十 
31y 二 1, 用 扩展 欧 几 里 得 算法 求 得 一 个 特 解 是 z= 二 4,y 二 一 1。 

方程 az 寺 1(mod m) 的 一 个 解 x, 称 xz 为 a 模 m 的 逆 。 注意 ,这 样 的 x 有 很 多 ,把 它们 
都 称 为 逆 。 

求 逆 元 的 代码 如 下 : 


int mod_inverse( int a, int m){ 

int x, y; 

extend_gcd(a, m, x, y); 

return(m + x % m) % m; //x 可 能 是 负数 ,需要 处 理 
上 


另外 ,在 某 些 情况 下 也 可 以 用 费 马 小 定理 求 逆 元 。 

4. 逆 元 与 除法 取 模 

道 元 的 一 个 重要 应 用 是 求 除法 的 模 。 在 后 面 讲 Catalan 数 的 时 候 有 这 样 一 个 需求 : 求 
(a/b)mod m, 即 a 除 以 5, 然 后 对 m 取 模 。 由 于 这 里 a 和 4 都 是 很 大 的 数 , 做 除法 后 再 取 模 
会 损失 精度 。 下 面 的 方法 可 以 避 开 除法 计算 。 


设 5 的 道 元 是 ,有 : 
(EJmoa m = (Ejmoa m ) ot Ymod m) = (Sor Jmod m= (ak)mod m 


上 述 推导 过 程 把 除法 的 模 运 算 转 换 成 了 乘法 模 运 算 : (a/b)mod m= (ak)mod m 

S$. 逆 元 与 求解 二 元 一 次 方程 ax 十 my 一 

如 果 得 到 了 a 的 逆 , 可 以 来 求解 形 如 az 三 b(mod zz) 的 任何 同 余 方程 。 方 法 如 下 : 令 
a 是 a 模 m 的 道 , 则 a4 三 1(mod m); 在 az 三 b(mod m) 的 两 边 同 时 乘 以 w ,得 到 a'azx 三 
ab (mod m) ,所 以 xa’b (mod m)。 

例如 求 8z 三 24(mod 31) 的 解 。 先 求 8 模 31 的 逆 , 是 4; 然后 在 8+ 三 24(mod 31) 的 两 
边 乘 以 4, 得 到 8X4z 三 4X24(mod 31) ,所 以 x 三 96(mod 31)。 

前 面 讲 解 扩展 欧 几 里 得 算法 时 曾 求解 了 二 元 一 次 方程 ,这 里 再 给 出 利用 逆 元 的 另 一 种 


方法 ,如 表 8. 2 所 示 。 读 者 对 照 两 种 方法 ,可 以 加 深 对 逆 元 的 理解 。 
表 8.2 利用 逆 元 的 求解 方法 
例 : 求解 8z 十 31y 一 24 
求解 方程 cz 十 my 一 0 本 
步骤 同 余 方程 是 a 二 bCmod m) 同 余 方程 是 8+ 二 24(mod 31) 
a=8,6=24,m 二 31 
1 | 有 解 的 条 件 : gcd(a,m) 能 整除 5 gcd(8,31) 一 1 能 整除 24 
求 az 三 1(mod m) 的 逆 元 a ,等 价 于 用 扩展 欧 | 8z 十 31y 一 1 的 一 个 解 是 z=4,y 村 一 村 
几 里 得 算法 求解 cz 十 my 一 1 逆 元 是 w“ 一 4 
3 | 一 个 特 解 是 zx 一 ab 一 a0 一 4X24 一 96 
4 | 代入 方程 wz 十 my 一 0 求解 y 代入 8z 十 31y 一 24, 得 到 y= 一 24 
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【习题 】 
hdu 5976“Detachment”, 乘 法 逆 元 。 
8.2.6 素数 


1. 用 试 除法 判断 素数 

问题 : 输入 一 个 很 大 的 数 ”判断 它 是 不 是 素数 。 

素数 定义 : 一 个 数 ,如果 不 能 被 [2,n 一 1] 内 的 所 有 数 整 除 ,n 就 是 素数 。 当 然 , 并 不 需 
要 把 [2,n 一 1] 内 的 数 都 试 一 遍 , 这 个 范围 可 以 缩小 到 [2,Vn]。 

给 定 2 如 果 它 不 能 整除 [2,Vz] 内 的 所 有 数 , 它 就 是 素数 。 证 明 如 下 : 

设 n=aXb, 有 min(a,b)<Vn, 令 a 三 5。 只 要 检查 [2,Vn] 内 的 数 , 如 果 不是 素数 ,就 
能 找到 一 个 a。 如果 不 存在 这 个 a, 那么 (Vn ,n 一 1] 内 也 不 存在 5。 

以 上 判断 的 范围 可 以 再 缩小 一 点 : [2,Vn] 内 所 有 的 素数 。 其 原理 很 简单 ,读者 在 学 过 
下 文 提 到 的 埃 式 筛 法 之 后 更 容易 理解 。 


用 试 除法 判断 素数 ,复杂 度 是 O(n) ,对 于 nn 二 10 的 数 是 没有 问题 的 。 
下 面 是 试 除法 判断 素数 的 代码 。 


判断 素数 
bool is_prime(int n){ 
if(n<=1) return false; //1 不 是 素数 
for(int i=2; ixi<=n; i++) // 比 这 样 写 更 好 : for(int i=2;i<= sqrt(n);i++) 


if(n % i == 0) return false; ”// 能 整除 ,不 是 素数 
return true; 


} 


2. 巨大 素数 的 判断 

如 果 非常 大 ,例如 poj 1811 题 ,1 二 nm 二 2%* ,判断 是 不 是 素数 。 如 果 用 试 除法 ,Vn 二 
2” 守 105 ,复杂 度 仍然 太 高 。 此 时 需要 用 到 特殊 而 复杂 的 方法 ,如 果 读 者 有 兴趣 ,可 以 自己 
查 资料 0。 

3. 用 埃 式 筛 法 求 素数 的 数量 

一 个 与 素数 相关 的 问题 是 求 [2,n] 内 所 有 的 素数 。 如 果 用 上 面 的 试 除法 ,一 个 个 单独 
进行 判断 , 太 慢 了 。 

埃 式 筛 法 是 一 种 古老 而 简单 的 方法 ,可 以 快速 找到 [2,n] 内 所 有 的 素数 。 对 于 初始 队 
列 {2,3,4,5,6,7,8,9,10,11,12,13,…,n) ,操作 步骤 如 下 : 

(1) 输出 最 小 的 素数 2, 然 后 筛 掉 2 的 倍数 , 剩 下 {3,5,7,9,11,13,…); 


外 《ACM/ICPC 算法 训练 教程 ), 余 立功 ,清华 大 学 出 版 社 ,127 页 。 
"163 5 


算法 竞赛 入 门 到 进 阶 


(2) 输出 最 小 的 素数 3 ,然后 筛 掉 3 的 倍数 , 剩 下 15.7.11,13,…}; 

(3) 输出 最 小 的 素数 5, 然 后 筛 掉 5 的 倍数 , 剩 下 {7,11,13,…})。 

继续 以 上 步骤 ,直到 队列 为 空 。 

下 面 是 程序 ,其 中 visit[ 门 记录 数 i 的 状态 ,如 果 visit[ 门 ==true, 表 示 它 被 筛 掉 了 ,不 是 
素数 。 用 prime[ ] 存 放 素 数 , 例 如 prime[L0] 是 第 1 个 素数 2。 


const int MAXN = le7; // 定 义 空间 大 小 ,1e7 约 10MB 
int prime[ MAXN + 1]; // 存 放 素数 , 它 记 录 visit[i] = false 的 项 
bool visit[MAXN + 1]; //true 表示 被 筛 掉 , 不 是 素数 
int E sieve(int n) { // 埃 式 筛 法 ,计算 [2，n] 内 的 素数 
int k=0; // 统 计 素 数 的 个 数 
for(int i=0; i<=n; i++) visit[i] = false; // 初 始 化 
for(int i=2; i<=n; i++){ // 从 第 1 个 素数 2 开始 .可 优化 (1) 
if(!visit[i]) { 
prime[k++] = i; //i 是 素数 ,存储 到 prime[ ] 中 
for(int j=2*#i; j<=n; j+=i) //i 的 倍数 都 不 是 素数 。 可 优化 (2) 
visit[j] = true; // 标 记 为 非 素数 , 筛 掉 
} 
} 
return k; // 返 回 素数 的 个 数 


计算 复杂 度 : 2 的 倍数 被 得 掉 ,计算 mn/2 次 ; 3 的 倍数 被 得 掉 , 计 算 n/3 次 ; 5 的 倍数 被 
筛 掉 , 计 算 n/5 次 , 依 此 类 推 。 总 次 数 是 O(n/2 十 n/3 十 n/5 十 …), 这 里 直接 给 出 结果 , 即 
O(nloglogsn)。 

空间 复杂 度 : 程序 用 到 了 bool visitLMAXN 十 1] 数 组 , 当 MAXN=10’ 时 约 10MB。 一 
般 题 目 会 限制 空间 为 65MB, 所 以 n 不 能 再 大 了 。 

上 述 代码 有 两 处 可 以 优化 : 

(1) 用 来 做 筛 除 的 数 为 2.3、5 等 ,最 多 到 Vn 就 可 以 了 。 例 如 求 n==100 以 内 的 素数 ,用 
2、3、5、7 得 就 足够 了 。 其 原理 和 试 除 法 一 样 : 非 素数 上 必定 可 以 被 一 个 小 于 等 于 从 的 素数 
整除 。 

(2) for(int j 二 2*i; j< 一 n; j 十 一 iD 中 的 7 一 2*i 优化 为 7 一 zxi。 例 如 i 一 5 时 ,2x5、 
3x*5、4x*5 已 经 在 前 面 i=2,3,4 的 时 候 筛 过 了 。 

优化 后 的 代码 如 下 : 


int E sieve(int n) { 
for(int i = 0; i<=n; i++) visit[i] = false; 
for(int i = 2; i*i<=n; i++) // 筛 掉 非 素数 
if(!visit[i]) 
for(int j=i*i; j<=n; j+=i) 


visit[j] = true; // 标 记 为 非 素 数 
// 下 面 记录 素数 
int k=0; // 统 计 素 数 的 个 数 


for(int i = 2; i<=n; i++) 
if(!visit[i]) 
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prime[k++] = i; // 存 储 素数 
return k; 


} 


埃 式 筛 法 虽然 还 不 错 , 但 其 实 做 了 一 些 无 用 功 , 某 个 数 会 被 筛 几 次 ,比如 12, 被 2 和 3 
划 了 两 次 。 另 一 种 欧 拉 筛选 法 ,时间 复杂 度 仅 为 O(n) ,如 果 读 者 有 兴趣 可 以 查 资料 。 不 过 ， 
埃 式 得 法 可 以 近似 看 成 O(0z) 的 ,一 般 也 够 用 了 。 

4. 埃 式 筛 法 应 用 于 大 区 间 素 数 

用 埃 式 筛 法 求 [2,n] 内 的 素数 ,只 能 解决 规模 n 二 107 的 问题 。 如 果 更 大 ,在 某 些 情 况 
下 可 以 用 埃 式 筛 法 来 处 理 , 这 就 是 大 区 间 素 数 的 计算 。 

如 果 把 [2, 站 看 成 一 个 区 间 ,那么 可 以 把 埃 式 筛 法 扩展 到 求 区 间 [e , 引 的 素数 ,ae 一 0 乏 
101 ,6—a<<10°。 

前 文 提 到 ,用 试 除 法 判断 n 是 不 是 素数 ,原理 为 : 如 果 它 不 能 整除 2 一 内 所 有 的 素 
数 , 它 就 是 素数 。 根 据 埃 式 筛 法 很 容易 理解 这 个 原理 : 2 一 内 的 非 素数 肯定 对 应 一 个 比 
它 小 的 素数 a。 在 用 试 除法 的 时 候 , 如果 nn 能 整除 4, 已 经 证 明了 nn 不 是 素数 ,b 就 不 用 再 
试 了 。 

这 个 原理 可 以 用 来 理解 大 区 间 求 素数 问题 。 先 用 埃 式 筛 法 求 [2,V] 内 的 素数 ,然后 用 
这 些 素数 来 得 [we ,中 区 间 的 素数 即 可 。 

(1) 计算 复杂 度 : ObloglogW) 十 DC(0 一 ac) V6 一 a); 

(2) 空间 复杂 度 : 需要 定义 两 个 数组 ,一 个 用 于 处 理 [2,V5] 内 的 素数 , 另 一 个 用 于 处 理 
[ae , 纪 内 的 素数 ,空间 复杂 度 是 O(W6) 十 0(b 一 a)。 

习题 : poj 2689, 求 [L,R] 内 的 素数 ,1<<L<R<2 147 483 647),R 一 L<10°。 

5. 更 大 的 素数 

上 面 埃 式 得 法 的 限制 条 件 是 n 三 10”。 如 果 要 统计 更 大 范围 内 的 素数 个 数 ,例如 = 
10u 时 有 40 多 亿 个 素数 ?, 此 时 需要 用 到 更 复杂 的 数学 方法 。 如 果 读 者 有 兴趣 可 以 研究 
hdu 5901 Count primes 一 题 , 求 1] 委 " 委 102 范围 内 的 素数 个 数 。 


【习题 】 


hdu 1262 ,寻找 素数 对 。 
hdu 2710 ,得 法 求 素数 。 
hdu 3792 ,素数 打 表 。 
hdu 3826 ,分 解 质 因子 。 
hdu 6069, 区 间 素 数 。 


@ [2, 站 内 素数 的 数量 : https://en. wikipedia. org/wiki/Prime-counting_function( 永 久 网 址 : perma. cc/MSN6- 
F4AMD 。 
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8.3 组 合 数学 


人 们 在 生活 中 经 常会 遇 到 排列 组 合 问题 。 简 单 的 ,例如 在 5 个 礼物 中 选 两 个 , 问 有 多 少 
种 选取 方法 ? 复杂 一 点 的 ,例如 一 串 手 环 , 用 不 同 颜色 的 珠子 串 成 , 问 有 多 少 种 不 同 的 排列 
方法 ? 

组 合 数学 就 是 研究 一 个 集合 内 满足 一 定 规则 的 排列 问题 。 这 类 问题 如 下 : 

(1) 存在 问题 , 即 判断 这 些 排 列 是 否 存在 ; 

(2) 计数 问题 ,计算 出 有 多 少 种 排列 ,并 构造 出 来 ; 

(3) 优化 问题 ,如 果 有 最 优 解 ,给 出 最 优 解 。 

组 合 数学 涉及 的 内 容 很 多 ,包括 了; 

(1) 基本 计数 规则 ,例如 乘法 规则 、 加 法 规则 、 生 成 排列 组 合 、 多 项 式 系 数 、 铝 巢 ( 抽 居 ) 

(2) 计数 问题 ,例如 母 函数 (普通 型 指数 型 .概率 型 等 )、 二 项 式 定 理 、 递 推 关 系 、 容 斥 定 
理 ,.P6lya 定理 等 。 

(3) 存在 问题 ,例如 编码 ,组合 设 计 、 图 论 中 的 存在 问题 等 。 

(4) 组 合 优化 ,例如 匹配 和 覆盖 、 图 和 网 络 的 优化 问题 。 

本 书 的 内 容 涉 及 前 两 部 分 , 即 计 数 规则 和 计数 问题 。 


8.3.1 名 巢 原理 


铅 梨 原理 (Pigeonhole Principle) ,或 称 抽 居 原理 (Drawer Principle) ,内 容 非 常 简单 : 把 
n 十 1 个 物体 放 进 nn 个 盒子 ,至 少 有 一 个 盒子 包含 两 个 或 更 多 的 物体 。 

铅 梨 原理 是 很 基本 的 组 合 原理 ,但 是 可 以 解决 许多 有 趣 的 问题 ,得 到 一 些 有 趣 的 结论 。 
例如 : 在 1500 人 中 ,至 少 有 5 人 生日 相同 ; n 个 人 互相 握手 ,一 定 有 两 个 人 握手 的 次 数 
相同 。 


hdu 1205“ 吃 糖果 ” 
Gardon 有 上 种 糖果 ,每 种 数量 已 知 ,Gardon 不 喜欢 连续 两 次 吃 同 样 的 糖果 , 问 有 
没有 可 行 的 吃 糖 方 案 。 


该 题 是 非常 典型 的 铅 梨 原理 问题 ,可 以 用 * 隔 板 法 ?求解 。 找 出 最 多 的 一 种 糖果 ,把 它 的 
数量 N 看 成 NN 个 隔 板 , 隔 成 N 个 空间 (把 每 个 隔 板 的 右边 看 成 一 个 空间 ); 其 他 所 有 糖果 
的 数量 为 S。 

(1) 如 果 S<N 一 1, 把 S 个 糖果 放 到 隔 板 之 间 , 这 N 个 隔 板 不 够 放 , 必然 至 少 有 两 个 隔 


加 ”参考 (应 用 组 合 数学 ),Fred S. Roberts、Barry Tesman 著 , 汉 速 译 , 机 械 工业 出 版 社 。 这 本 书 几乎 包罗 了 所 有 的 
组 合 数学 知识 。 这 类 书 的 特点 是 过 于 详细 ,读者 不 可 能 通读 所 有 内 容 ,也 不 太 容 易 提 炼 出 一 些 知识 点 的 算法 思想 。 建 议 
读者 边 做 竞赛 题 边 查阅 有 关 知 识 , 这 样 能 很 快 地 把 知识 与 应 用 结合 起 来 。 
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板 之 间 没 有 糖果 ,由 于 这 两 个 隔 板 是 同一 种 糖果 ,所 以 无 解 。 

(2) 当 S 三 N 一 1 时 ,肯定 有 解 。 其 中 一 个 解 是 把 S 个 糖果 排 成 一 个 长 队 , 注 意 同 种 类 
的 糖果 是 挨 在 一 起 的 ,然后 每 次 取 N 个 糖果 , 按 顺序 一 个 一 个 地 放 进 N 个 空间 。 由 于 隔 板 
的 数量 比 每 一 种 糖果 的 数量 都 多 ,所 以 不 可 能 有 两 个 同样 的 糖果 被 放 进 一 个 空间 里 。 把 S 
个 糖果 放 完 ,就 是 一 个 解 ,一些 隔 板 里 面 可 能 放 几 种 糖果 。 

铝 巢 原理 是 Ramsey 定理 的 一 个 特例 。 读 者 可 以 通过 这 两 题 来 了 解 Ramsey 定理 , 即 
hdu 5917/6152 ,它们 是 2016、2017 年 的 比赛 题 。 


【习题 】 


poj 2356/3370。 
hdu 1808/3183/5776 。 


8.3.2 杨辉 三 角 和 二 项 式 系数 


读者 一 定 非常 熟悉 排列 和 组 合 公式 。 


| 
排列 : A =DT 


wa 
组 合 : C ( kl kl(n—k)! 


这 里 把 组 合 数 Ct 用 符号 [”] 表 示 , 称 为 二 项 式 系 数 (Binomia Coefficient) 。 


杨辉 三 角 (国外 称 由 斯 卡 三 角 ) 是 二 项 式 系数 | ”] 的 奥 型 应 用 ， 
杨辉 三 角 是 排列 成 如 下 三 角形 的 数字 


到 7 站- 省 :二 
1 1030 多 
每 一 行 从 上 一 行 推导 而 来 。 如 果 编 程 求 杨辉 三 角 第 行 的 数字 ,可 以 模拟 这 个 推导 过 
程 , 逐 级 递 推 ,复杂 度 是 O(m*)。 不 过 , 阁 改 用 数学 公式 计算 , 则 可 以 直接 得 到 结果 , 比 用 递 
推 快 多 了 ,这 个 公式 就 是 (1 十 zx)"。 
观察 (1 十 x )" 的 展开 : 
(1+z)=1 
(1+zx)!=1+z 
(1 二 xz)* = 二 1 十 2z 十 x? 
(二 区 六 三 工 于 3 二 3 辣 十 灾 
每 一 行 展开 的 系数 刚好 对 应 杨辉 三 角 每 一 行 的 数字 。 也 就 是 说 ,杨辉 三 角 可 以 用 
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(1 十 x)" 来 定义 和 计算 。 


那么 如 何 计算 (1 十 zx)"? 真 的 需要 展开 算 系数 吗 ? 并 不 需要 , 二 项 式 系数 | 


CT 就 是 (1 二 z)" 展开 后 的 系数 。 它 们 的 关系 可 以 这 样 理解 ， (1 十 z)* 的 第 项 , 实 


际 上 就 是 从 为 个 zx 中选 出 个 ,这 就 是 组 合 数 [”] 的 定义 。 所 以 ， 


(1+z)" = 3 


i\k 
这 个 公式 称 为 二 项 式 定理 。 
有 了 这 个 公式 ,在 求 杨辉 三 角 第 nn 行 的 数字 时 就 可 以 用 公式 直接 计算 了 ,复杂 度 为 
0O(1)。 不 过 ,该 公式 中 有 n!, 如 果 直 接 计算 n!1, 由 于 太 大 ,有 可 能 溢出 。 例 如 hdu 2032 题 ， 


QW 
4 二 30,30! 超过 了 long long 的 范围 此 时 可 以 利用 ”| ] 和 |] 的 过 推 关系 人 


后 


2 一 全 1 丈 个 推导 ,各 免 计算 阶乘 。 


8.3.3 容 斥 原 理 


容 斥 原理 (Inclusion-Exclusion Principle) 是 常见 的 思维 方法 。 在 计数 时 ,有 时 情况 比较 
多 ,相互 有 重合 。 为 了 使 重生 部 分 不 被 重复 计算 ,可 以 这 样 处 理 : 先 不 考虑 重生 的 情况 ,把 
所 有 对 象 的 数目 计算 出 来 ,然后 减 去 重复 计算 的 数目 。 这 种 计数 方法 称 为 容 斥 原理 。 

例如 一 根 长 为 60m 的 绳子 ,每 隔 3m 做 一 个 记号 ,每 隔 4m 也 做 一 个 记号 ,然后 把 有 记 
号 的 地 方 剪 断 , 问 绳子 共 被 前 成 了 多 少 段 ? 容 斥 原理 的 解 题 思 路 是 : 3 的 倍数 有 20 个 ,不 算 
绳子 两 头 ,有 20 一 1==19 个 记号 ; 4 的 倍数 有 15 个 ; 既是 3 的 倍数 又 是 4 的 倍数 的 ,有 60 二 
(3X4)==5 个 。 所 以 记号 的 总 数量 是 (20 一 1) 十 (15 一 1) 一 (5 一 1) 二 29, 强 子 被 前 成 29 段 。 


【习题 】 


hdu 2841/4135/4497/5155。 


8.3.4 Fibonacci 数列 


Fibonacci 数列 是 一 个 很 常见 的 递 推 数列 ,在 小 学 奥数 中 被 称 为 “兔子 数列 ”。Fibonacci 
数列 也 是 一 个 被 “神话 ”的 数列 ,人 们 常常 提 到 的 “黄金 分 割 " 就 蕴含 在 Fibonacci 数列 中 。 
1. Fibonacci 数列 的 递 推 公式 
| 
yn) = Fn— D4 
从 第 3 项 开始 ,每 一 项 都 等 于 前 2 项 之 和 .前 一 部 分 数 是 1,1,2,3,5,8,13… 
*， 168 。 


当 交 趋 于 无 穷 大 时 , 相 邻 两 个 数 的 比值 f(x)/f(n 一 1) 一 0. 618 033 988 7… 这 就 是 有 名 
的 黄金 分 割 数 ?。 

2. 计算 Fibonacci 数列 

这 里 有 两 个 问题 : 四 如 何 更 快 地 计算 第 ”个 Fibonacci 数 ; @Fibonacci 数 增长 太 快 了 ， 
需要 处 理 大 数 。 

那么 如 何 计 算 Fibonacci 数列 ? 如 果 只 计算 到 第 10" 个 数 , 用 上 面 的 递 推 公式 就 可 以 ， 
复杂 度 是 O(n)。 如 果 更 大 ,例如 算 第 1 亿 个 数 ,这 样 就 比较 慢 。 对 于 这 么 大 的 Fibonacci 
数 , 需 要 用 一 种 巧妙 的 方法 : 把 递 推 关系 转换 成 矩阵 ,并 用 前 面 讲 过 的 和 矩阵 快速 短 进 行 处 
理 。 请 读者 自己 做 poj 3070 题 和 hdu 3117 题 , 求 第 1 亿 个 Fibonacci 数 ,这 是 一 个 必 做 题 。 

另外 ,Fibonacci 数 的 值 增长 非常 快 ,近似 于 OC(2") ,例如 第 40 个 数 是 102 334 155 ,已 经 
非常 大 ,所 以 常常 需要 处 理 大 数 ,或 者 做 取 模 操作 。 由 于 这 些 知识 在 前 面 讲 过 ,这 里 不 再 
歼 述 。 

3. 应 用 模型 

Fibonacci 数列 看 起 来 很 简单 ,但 是 应 用 却 非 常 广泛 。 例 如 在 排列 组 合 问题 中 ,很 多 场 
景 的 数学 模型 就 是 Fibonacci 数列 。 下 面 是 两 个 常见 的 例子 。 

1) 楼 梯 问 题 

hdu 2041 题 。 有 一 楼 梯 共 M 级 , 刚 开 始 时 人 在 第 一 级 , 若 每 次 只 能 跨 上 一 级 或 两 级 ,要 
走 上 第 M 级 ,共有 多 少 种 走 法 ? 

假设 到 第 nn 级 总 共 的 走 法 为 1(n)。 如 何 到 达 第 级 ? 可 以 分 成 两 种 情况 : 四 第 一 次 
跳 1 级 , 剩 下 ?一 1 个 台阶 , 跳 法 是 f(n 一 1); 回 第 一 次 跳 2 级 , 剩 下 7 一 2 个 台阶 , 跳 法 是 
一 2) ,所 以 f(n)= 二 fn 一 1) 十 f(n 一 2)。 这 是 一 个 Fibonacci 数列 。 

2) 矩形 覆盖 问题 

用 2X1 的 小 矩形 覆盖 2n 的 大 矩形 ,总 共有 多 少 种 方法 ? 

假设 方法 总 共有 f(n) ,分 成 两 种 情况 : 四 第 一 次 放 1 格 , 剩 下 2 一 1 个 格子 ,方法 有 
ft 一] 上) 种; @ 第 一 次 放 2 格 , 剩 下 mn 一 2 个 格子 ,方法 有 f(n 一 2) 种 。 这 也 是 一 个 Fibonacci 
数列 。 


8.3.5 和 母 函 数 


本 节 介 绍 一 种 求解 递 推 关系 的 特殊 思路 一 一 母 函数 。 母 函数 (Generating Function, 又 
译 为 生成 函数 ) 是 算法 竞赛 中 经 常 使 用 的 一 种 解 题 方法 , 它 用 代数 方法 解决 组 合计 数 问题 ， 
是 数学 与 应 用 的 有 趣 结合 。 

本 节 尝 试 引导 读者 理解 母 函数 ,并 用 来 解决 一 些 算法 问题 。 不 过 ,读者 仍然 需要 进一步 
深入 地 学 习 母 函数 的 数学 思想 ,这 样 才 能 更 好 地 应 用 它 。 建 议 读者 阅读 一 些 组 合 数学 方面 
的 书籍 ,做 一 些 习 题 ,以 加 强 理解 2。 


@ 很 多 人 说 “黄金 分 割 美学 "其实 是 夸大 其 词 。 
回 《组 合 数 学 ),Richard A. Brualdi 著 , 冯 到 铂 译 ,机 械 工业 出 版 社 。 


“ 60% 


算法 竞赛 入 门 到 进 阶 


1. 整数 划分 

在 讲解 母 函 数 之 前 先 思 考 一 个 经 典 问题 一 一 整数 划分 。 整 数 划 分 是 指 把 一 个 正 整数 
分 解 成 多 个 整数 的 和 ,这 些 数 大 于 等 于 1、 小 于 等 于 n。 不同 划 分 法 的 总 数 叫 作 划 分 数 。 例 
如 n=4 时 有 5 种 划分 , 即 {1,1,1,1}、{1,1,2}、{2,2}、{1,3}、{4}。 

这 个 问题 有 很 多 扩展 ?了 ,例如 将 n 划分 成 最 大 数 不 超 过 m 的 划分 数 ,m 三 n。 当 ==4， 
m 二 2 时 有 3 种 划分 , 即 {1,1,1,1}、{1,1,2}、{2,2}。 


hdu 1028 “Ignatius and the Princess III” 
求 整 数 nn 有 多 少 种 划分 ,1 三 n 三 120。 
输入 一 个 数字 nn, 输 出 划分 数 。 


在 引入 母 函数 方法 之 前 先 用 递归 求解 ,代码 如 下 ,其 中 函数 part(n,n) 返 回 对 nn 划分 的 
结果 。 


递归 求 整数 划分 
#include <bits/stdc++.h> 
using namespace std; 
int part(int n, int m) { // 将 n 划分 成 最 大 数 不 超 过 nm 的 划分 数 
if(n==1||m==1) return (1); 
else if(n<m) return part(n,n); 
else if(n==m) return1 + part(n,n—1); 
else return part(n-m, m) + part(n, m-1); // 这 一 行 导致 TLE 
} 
int main(){ 
int n; 


while(cin >> n) 
cout << part(n, n) << endl; 
return 0; 


} 


函数 part() 的 最 后 一 行 有 两 种 情况 。 

(1) parttn 一 msm): 划分 中 有 一 个 数 为 m, 那 么 从 中 减 去 mm. 继续 对 n 一 m 进行 划分 ; 

(2) part(n,m 一 1): 划分 中 每 个 数 都 小 于 m, 即 每 个 数 不 大 于 mm 一 1 ,继续 划分 。 

但 是 ,用 上 面 的 递归 代码 提交 hdu 1028 题 , 结 果 是 TLE。 观 察 程序 的 最 后 一 行 ,发 现 
递归 翻 倍 ,是 0(2") 的 复杂 度 。 

用 DP 可 以 显著 降低 复杂 度 。 把 递归 程序 中 的 逻辑 改写 成 递 推 式 , 在 函数 part() 中 提 
前 预计 算出 所 及 的 划分 数 。 程 序 的 计算 复杂 度 是 O(n? ) 。 


用 DP 求 整数 划分 


const int MAXN = 200; 
int dp[ MAXN + 1][MAXN + 1]; //dp[n][m]: 将 n 划分 成 最 大 数 不 超 过 nm 的 划分 数 


@@ 扩展 的 划分 问题 : http://www. cnblogs. com/radiumlrb/p/5797168. html( 永 久 网 址 : perma. cc/92XR-N9DF) 。 


= 170» 


void part() { // 预 计算 中 [n][m], 求 出 所 有 nm 的 划分 
for(int n=1; n<= MAXN; n++) 
for(int m=1; m<= MAXN; m++){ 


if((n==1)||(n==1)) dp[n][m] = 1; 
else if(n<m) dp[n][m] = dp[n][n]， 
else if(n==m) dp[n][m] = dp[n][m-1]+1; 
Else dp[n][m] = dp[n][m-1] + dp[n—m][m]; 
} 
} 
下 面 用 母 隐 数 方法 求解 整数 划分 问题 。 
2. 母 函 数 的 概念 


在 解决 整数 划分 问题 之 前 先 通 过 一 个 更 简单 的 问题 介绍 母 函数 的 概念 。 

问题 : 从 数字 1、2、3、4 中 取出 一 个 或 多 个 相 加 (每 个 数 最 多 只 能 用 一 
次 ) ,能 组 合成 几 个 数 ? 每 个 数 有 几 种 组 合 ? 

在 表 8.3 中 ,第 1 行 是 组 合 得 到 的 数字 ,第 2 行 是 组 合 的 情况 ,第 3 行 是 
有 几 种 组 合 。 


表 8.3 数字 组 合 问题 


数字 S| 1 | 2 3 4 5 6 家 8 9 10 

组 合 中 外 演 | 1 十 3 十 4 | 2 十 3 十 4 | 1 十 2 十 3 十 4 
3 4 2 十 3 2 十 4 3 十 4 

数量 N| 1 | 1 2 2 中 2 2 1 1 


下 面 引进 一 个 公式 ,并 把 公式 展开 ,这 个 公式 能 解决 上 面 的 数字 组 合 问题 。 后 文 会 介绍 
ae 
2 sD ee Yh i he hn Bi 
2z 十 2zs 十 2z7 十 zs 十 9 十 Zr 
读者 仔细 观察 ,可 以 发 现 公式 和 上 面 的 表 是 有 关系 的 ， 
(1) 公式 左边 的 xz 的 罕 与 组 合用 到 的 数字 1、2、3、4 相对 应 。 观 察 公 式 左边 ,包括 
4 个 部 分 ,(1 十 z) 中 的 zx 是 1 次 震 ,(1 十 刀 ) 中 的 z 是 2 次 去 , 依 此 关 推 ,刚好 是 数字 1.2、 


Sts 
(2) 公式 右边 z 的 宪 与 表格 中 的 组 合 数 S 是 对 应 的 。 公 式 右边 zx 的 寡 从 1 到 10, 组 合 
数 S 也 从 1 到 10。 
(3) 公式 右边 的 系数 与 表格 中 的 数量 N 相对 应 ,都 是 1.1.2.2.2.2、.2、1、1、1。 


因此 ,用 这 个 公式 可 以 计算 上 面 的 组 合 数 问题 。 
这 就 是 母 函数 的 原理 :“ 把 组 合 问 题 的 加 法 与 协 级 数 的 乘 曙 对 应 起 来 ”。 
那么 ,这 个 公式 是 如 何 得 到 的 ? 
为 了 更 容易 理解 ,把 公式 左边 写成 以 下 的 形式 : 
(1 十 z)(1 十 zz)(1 十 zs)(1 十 z) 
和 
其 含义 以 公式 右边 的 (xz! 十 Zz1*1) 为 例 ,z"*! 表 示 不 用 数字 1,zx'*! 表 示 用 数字 1 。 
wR 
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所 以 ,这 个 公式 实际 上 就 是 组 合 问题 的 反映 : 用 或 者 不 用 数字 1、 用 或 者 不 用 数字 2、 用 
或 者 不 用 数字 3, 依 此 类 推 ,公式 就 是 这 样 构造 出 来 的 。 公 式 构造 出 来 后 ,把 它 展开 后 的 结 
果 就 是 组 合 问题 的 答案 。 

母 函 数 的 定义 : 对 于 序列 co ,ai ,as，… ,构造 函数 G(z) 二 qo 十 qz 十 azx?…, 称 G(xz) 为 
序列 co ,a ,as，… 的 母 函数 。 

简单 地 说 , 母 函数 是 一 种 竹 级 数 , 其 中 每 一 项 的 系数 反映 了 这 个 序列 的 信息 。 在 本 例 
中 ,akz 的 a 是 数 & 的 组 合 数量 。 

3. 用 母 函数 解决 整数 划分 问题 

整数 划分 比 上 面 的 数字 组 合 问题 复杂 一 些 , 因 为 整数 划分 的 数字 是 可 以 重复 的 。 可 以 


这 样 设计 整数 划分 的 母 函 数 : 
Ca a 
二 (1 十 Zz 十 石 十 …)(1 十 十 十 …)(1 十 十 x 十) 


其 中 ,Cz 十 zx 十 ZX*1 十 …) 的 含义 是 不 用 数字 1、 用 一 次 1、 用 两 次 1, 依 此 类 推 。 

母 函数 展开 后 ,第 zx" 项 的 系数 就 是 数字 的 划分 数 。 

那么 ,如 何 编 程 计 算 母 函数 展开 后 的 系数 ? 模拟 手工 计算 过 程 就 可 以 了 。 首 先 把 前 两 
部 分 (1 十 z 十 zz? 十 …) 和 (1 十 zx? 十 xz! 十 …) 相 乘 并 展开 ; 展开 的 结果 再 与 第 3 部 分 (1 十 x 十 
zx' 十 …) 相 乘 并 展开 ; 继续 这 个 过 程 直 到 完成 。 


用 母 函 数 求 整数 划分 (hdu 1028) 


const int MAXN = 200; 
int cl[MAXN + 1], c2[MAXN + 1]; 
void part() { 
int i, j,k; 
for(i=0; i<= MAXN; i++){ // 初 始 化 , 即 第 1 部 分 (1+x+x?+…) 的 系数 ,都 是 1 
cl[il]=1; c2[i]=0; 
} 
for(k= 2; k<= MAXN; k++){ // 从 第 2 部 分 (1+ x? +x*+…) 开 始 展 开 
for(i=0; i<=MAXN; i++) 
//k=2 时 ,i 循环 第 1 部 分 (1+ x+x?+…),j 循环 第 2 部 分 (1+x?+x*+…) 
for(j=0; j+i<=MAXN; j+=k) 
c2[i+j] += cl[i]; 
for(i=0; i<=MAXN; i++) { // 更 新 本 次 展开 的 结果 
ci[i] = c2[i]; c2[i] = 0; 
} 
} 


数组 第 cl[nj] 项 用 来 记录 每 次 展开 后 第 z 项 的 系数 ,计算 结束 后 ,cl[nj 就 是 整数 的 
划分 数 。 数 组 c2[] 用 于 记录 临时 计算 结果 。 

上 面 的 代码 可 以 当成 模板 ,请 读者 仔细 理解 细节 。 虽 然 不 同 的 问题 有 不 同 的 母 函 数 , 但 
都 是 方程 式 的 展开 ,代码 和 上 面 的 差不多 ,只 要 做 相应 的 修改 即 可 。 

本 节 讲 解 的 是 “普通 型 " 母 函数 ,可 用 于 求 组 合 方案 数 ; 还 有 一 种 “指数 型 " 母 函数 ,用 于 
求 排列 数 。 例 如 {1 ,2,3,4} ,要 求 每 个 数字 用 且 只 用 一 次 ,那么 组 合 方案 只 有 1 种 ,而 排列 有 
si 


4! 一 24 种 。 

求 组 合 方案 的 题目 ,如 果 能 用 普通 型 母 函数 求解 2, 一 般 也 能 用 DP 求 解 。 但 是 , 众 所 周 
知 ,DP 的 难点 在 于 递 推 关 系 , 想 不 到 就 做 不 出 来 ; 而 母 函 数 的 思路 是 很 直观 的 ,容易 理解 。 
比如 整数 划分 问题 , 母 函 数 的 方法 要 比 DP 简单 一 些 。 


4. 指数 型 母 函数 
先 看 一 个 典型 的 例题 一 一 hdu 1521 题 。 


hdu 1521“ 排 列 组 合 ” 

有 nn 种 物品 ,并 且 知 道 每 种 物品 的 数量 , 求 从 中 选 出 m 件 物 品 的 排列 数 。 例 如 有 两 
种 物品 A、B, 并 且 数 量 都 是 1, 从 中 选 两 件 物品 , 则 排列 有 "AB" 和 "BA" 两 种 。 

输入 : 每 组 输入 数据 有 两 行 ,第 1 行 是 两 个 数 n 和 m(1 三 m,n 三 10), 表 示 物 品 数 ; 
第 2 行 有 nn 个 数 ,分 别 表示 这 九 件 物品 的 数量 。 

输出 : 对 应 每 组 数据 输出 排列 数 (任何 运算 不 会 超出 2 ^31 的 范围 ) 。 


分 析 题 目 ,假设 有 3 种 物品 A、B、C, 数 量 分 别 是 2、3、1, 即 {A,A,B,B,B,C}), 从 中 选 两 
件 物品 , 则 排列 是 {AA,AB,BA,AC,CA.,BB,BC,CB) , 共 8 种 。 

针对 这 个 例子 ,直接 给 出 指数 型 母 函数 的 解决 方案 。 下 面 表达 式 的 第 1 行 是 母 函 数 公 
式 , 第 2 行 展 开 , 第 3 行 整理 : 


入 
GCz) 人 + 若 : sj + 于 十 车 


和 re | 2x! | yr | 让 
2 
1 十 兰 十 萝 十 亲 阅 十 是 下 十 呈 辣 十 吕 


第 1 行 的 3 个 括号 内 分 别 代表 两 个 A.3 个 B,、1 个 C。 
答案 就 隐 含 在 最 后 一 行 中 。 例如 站 , 的 上 3 表示 选 3 件 物品 ,系数 19 表示 有 19 种 排 


列 。 这 一 行 给 出 了 所 有 的 答案 : 物品 A、B、C, 数 量 分 别 有 2、3、1 个 ,那么 选 一 件 物品 的 排列 有 
3 种 . 选 两 件 有 8 种 . 选 3 件 有 19 种 . 选 4 件 有 38 种 . 选 5 件 有 60 种 . 选 6 件 有 60 种 。 
是 不 是 很 神奇 ?下面 分 析 母 函数 公式 。 


把 公式 写成 兰 、 奇 、 奇 这 样 的 形式 ,实际 上 是 在 处 理 排列 。 例 如 ,第 1 行 的 第 1 部 分 


(+ 理 + 加 是 对 物品 AC 有 两 个 A) 的 排列 。 为 了 容易 理解 ,可 以 改写 成 [ 靳 二 二 十 区 )， 


声 -, 不 选 A 的 排列 有 1 种 , 即 ($); 


博 , 选 1 件 人 A 的 排列 有 1 种 , 即 {A); 


@ 这 里 对 整数 划分 给 出 了 有 趣 的 解释 :《 组 合 数学 ),Richard A. Brualdi 著 , 机 械 工业 出 版 社 ,8. 3 节 , 分 拆 数 。 
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贰 , 选 丙 件 A 的 排列 有 1 种 , 即 {AA). 
同 理 ,选号 物品 (有 3 个 BD 时 计算 公式 是 (1 十 辣 十 雄二 加 ], 先 C 物 品 (有 1 个 C) 时 计 


算 公式 是 (1+ 若 ]。 

当 同时 选 多 个 物品 时 ,把 公式 相 乘 ,其 展开 项 就 是 排列 情况 。 例 如 选 A. 了 两 种 物品 ,A 
的 车 与 也 的 二 相 乘 , 表 示 选 1 个 A, 再 选 3 个 卫 的 排列 数量 ,计算 得 到 关 X 二 一 二 一 公分 
子 系数 是 4, 表示 有 4 种 排列 ,它们 是 {ABBB.BABB,BBAB,BBBA}。 

为 什么 要 将 分 母 写成 11.21、31 这 样 的 形式 ? 它 体现 了 排列 和 组 合 的 关系 : 个 物品 
的 排列 和 个 物品 的 组 合 相差 &! 倍 。 在 选 多 个 物品 时 ,利用 这 个 特点 可 以 处 理 多 重组 合 的 
排列 问题 

例如 A 有 两 个 .B 有 3 个 ,组 合 只 有 一 种 ,是 (A,A,B,B,B) ,下 面 求 排列 数 。 


QD 两 个 A 的 排列 公式 是 车 ,分母 的 2! 处 理 了 排列 的 问题 : 如 果 是 两 个 不 同 的 Ai、 
As ,应 该 有 两 种 排列 , 即 {A,A, ,A;A, ) ,但 是 Ai .A, 相同 ,所 以 需要 除 以 21, 得 到 一 种 排列 
{AA}。, 

C2 的 排列 公式 是 于 ,分 析 是 一 样 的 ,分 母 除 以 31! , 史 除 重复 的 排列 ,得 到 一 种 排 
列 {BBB}。 


0 区 
(3) 合 起 来 排列 公式 是 57 X35 一 区 一 51 ,分 子 的 系数 是 10, 表 示 有 10 种 排列 


{AABBB,ABABB,ABBAB,… } 。 
现在 给 出 指数 型 母 函数 的 定义 : 对 序列 ao ,a ,az ,…:' 构 造 函 数 G(Cz) 一 an 1 十 


名 3 , 称 G(x) 为 序列 ao wa,as，,… 的 指数 型 母 函 数 。 


a 
指数 型 母 函 数 的 程序 和 普通 型 母 函 数 的 程序 非常 相似 ,只 多 了 对 分 母 &! 的 处 理 。 
hdu 1521 题 的 程序 留 给 读者 自己 编写 。 


8.3.6 特殊 计数 


1.Catalan 数 


1) 定义 
Catalan 数 是 一 个 数列 , 它 的 一 种 定义 如 下 : 


(RE 站 二 0 流放 
ee n= 0,1,2, 


前 一 部 分 Catalan 数 是 1,1,2,5,14,42,132,429,1430,4862,16796,58786,208012， 
742900,2674440,9694845,35357670.…Catalan 数 的 增长 速度 极 快 。 
Catalan 数 看 起 来 有 点 奇怪 ,但 是 观察 它 的 公式 ,其 中 有 组 合计 数 。 实 际 上 ,Catalan 数 


.174 : 


是 很 多 组 合计 数 应 用 问题 的 数学 模型 ,是 一 个 很 常见 的 数列 ?。 
Catalan 数 有 以 下 两 种 基本 模型 。 


1 {2n 2n 2n 2n 2n 
. 几 攻 到 6 
人 (| 四 i - 有 


其 由,”) 是 在 2 种 情况 中 选 1 个 的 组 合 数 ; [> ] 是 在 2 种 情况 中 选 一 1 个 的 


n 一 二 


2n 
人， 

模型 工 的 公式 可 以 从 一 个 基本 模型 推导 出 来 : 把 个 1 和 个 0 排 成 一 行 ,使 这 一 行 
的 任意 前 & 个 数 中 1 的 数量 总 是 大 于 或 等 于 0 的 数量 (或 者 0 的 数量 大 于 等 于 1 的 数量 ,二 
者 等 价 ) 。 这 样 的 排列 有 多 少 个 ? 答案 是 这 样 的 排列 一 共有 C, 个 , 即 Catalan 数 。 

模型 工 : 第 工种 模型 是 递 推 。 

= 

下 面 几 个 应 用 场景 可 以 按 上 面 两 个 模型 进行 解释 。 

2) 棋盘 问题 

hdu 2067 题 。 


组 合 数 。 生意 ,[ ~” jm 


六 一 


hdu 2067“ 小 免 的 棋盘 ” 
小 免 的 叔叔 从 外 面 旅游 回来 给 它 带 来 了 一 个 礼物 ,小 免 高 兴 地 跑 回 自己 的 房间 , 折 
开 一 看 是 一 个 棋盘 ,小 免 有 所 失望 。 不 过 没 过 几 天 它 发 现 了 棋盘 的 好 玩 之 处 ,从 起 点 
(0,0) 走 到 终点 (n,n) 的 最 短路 径 数 是 C(2n,n) ,现在 小 免 想 如 果 不 穿 过 对 角 线 (但 可 接 
触 对 角 线 上 的 格 点 ) ,这样 的 路 径 数 有 多 少 ? 


题目 的 意思 是 一 个 n 行 n 列 的 棋盘 ,从 左下 角 走 到 右上 角 , 一 直 在 对 角 线 右 下 方 走 , 不 
穿 过 主 对 角 线 , 走 法 有 和 多少 种 ?例如 ==4 时 有 14 种 走 法 。 

这 个 问题 就 是 上 面 的 基本 模型 ( 工 ) ,下 面 进 行 分 析 。 

对 方向 编号 ,向 上 是 0, 向 右 是 1, 那 么 从 左下 角 走 到 右上 和 角 一 定 会 经 过 nn 个 1 和 个 0。 
满足 要 求 的 路 线 是 走 到 任意 一 步 上 ,前 & 步 中 向 右 的 步 数 (1 的 个 数 ) 大 于 或 等 于 向 上 的 步 数 
(0 的 个 数 ) ,否则 就 穿 过 对 角 线 了 。 

设 从 左下 角 走 到 右上 角 的 总 路 线 有 X 条 ,分 成 3 个 部 分 : 对 角 线 下 面 的 A 条 路 线 , 对 
角 线 上 面 的 B 条 路 线 , 穿 过 对 角 线 的 C 条 路 线 。 不 过 ,这 3 个 部 分 可 以 简化 为 两 个 部 分 , 即 
对 角 线 下 面 的 A、 穿 过 对 角 线 的 Y( 包 括 忆 和 C)。A=X 一 Y 就 是 答案 。 


总 路 线 x 一]- 它 的 意思 是 在 2 个 位 置 放 个 1( 剩 下 的 个 肖 定 是 0) ,这 样 的 数 有 


@@ ”这 里 列 出 了 很 多 Catalan 数 的 应 用 ,注意 看 其 中 的 棋盘 问题 : https://en. wikipedia. org/wiki/Catalan_number 
( 短 网 址 : t. cn/RITgbAG) 。 
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对 于 Y, 需 要 用 到 一 种 叫 作 Andre's reflection method 的 方法 。 图 8. 1(a) 给 出 了 一 条 
穿 过 对 角 线 的 路 线 ( 即 C 路 线 ; 或 者 给 出 一 条 在 斜 对 角 上 方 并 不 穿 过 对 角 线 的 路 线 , 即 B 
路 线 , 分 析 和 C 路 线 一 样 ) 。 在 图 8. 1(b) 中 , 画 一 条 新 的 对 角 线 ,把 它 画 在 原来 对 角 线 的 上 
面 一 格 。 


(nl, nt1) 


(a) 一 条 穿 过 对 角 线 的 路 线 (b) 按 新 对 角 线 映射 


8.1 Andr6's reflection method 


下 面 开 始 操作 : 原来 的 路 线 , 从 左下 角 出 发 ,第 一 次 接触 到 这 条 新 对 角 线 后 ,把 剩 下 的 
部 分 以 新 对 角 线 为 轴 进 行 映射 ,得 到 新 的 路 线 。 这 条 新 的 路 线 即 图 8. 1 中 加 粗 的 黑 线 。 加 
粗 黑 线 下 面 的 一 部 分 黑 线 是 原来 的 ,保持 不 变 ; 上 面 一 部 分 是 新 的 ,与 原来 那 一 部 分 对 称 。 
整个 路 线 仍然 是 连续 的 ,但 是 路 线 的 终点 变 为 (n 一 1,n 十 1)。 注 意 ,“ 在 原 对 角 线 右 下 方 不 
穿 过 主 对 角 线 的 走 法 ”, 即 前 文 提 到 的 A 部 分 ,与 新 对 角 线 无 交集 ,无 法 映射 ,被 排除 在 外 。 

新 的 路 线 和 原来 的 路 线 是 一 一 对 应 的 。 这 些 新 路 线 有 多 少 个 ? 此 时 及 十 1 个 0、n 一 1 


个 1, 共 2n 个 ; 选 出 n 一 1 个 1( 等 价 于 选 出 十 1 个 0) 的 排列 有 | 站 二 


| 
因此 a-x-Y=(™)-( | 


n 和 一 站 

3) 括号 问题 

括号 问题 ; 用 个 左 括号 入 个 右 括号 组 成 一 串 字 符 串 有 多 少 种 合法 的 组 合 ? 例如 ， 
“( )( ) (( ) )” 是 合法 的 ,而 “( ) )(( )” 是 非法 的 。 显然 ,合法 的 括号 组 合 是 : 任意 前 
个 括号 组 合 , 左 括号 的 数量 大 于 等 于 右 括 号 的 数量 。 

定义 左 括号 为 0、 右 括号 为 1。 问 题 转化 为 n 个 0 和 个 1 组 成 的 序列 ,在 任意 前 个 
序列 中 0 的 数量 都 大 于 等 于 1 的 数量 。 模 型 和 上 面 的 棋盘 问题 一 样 。 

读者 可 以 练习 hdu 5184 题 : 给 定 初始 的 括号 序列 , 青 给 定 n 表示 序列 的 总 长 度 , 问 一 
共有 多 少 种 括号 组 成 方式 ? 

4) 出 栈 序列 问题 

给 定 一 个 以 字符 串 形 式 表 示 的 人 栈 序列 , 求 出 一 共有 多 少 种 可 能 的 出 栈 顺 序 ? 比如 入 
栈 序 列 为 {1 2 3} , 则 出 栈 序列 一 共有 5 种 , 即 (123}、{132)、{213)、{(231)、{(321)。 

分 析 可 知 , 合 法 的 序列 是 对 于 出 栈 序列 中 的 每 一 个 数字 ,在 它 后 面 的 比 它 小 的 所 有 数字 
一 定 是 按 递减 顺序 排列 的 。 例 如 ,{3 2 1} 是 合法 的 ,3 出 栈 之 后 , 比 它 小 的 后 面 的 数字 是 
{2 1}, 且 这 个 顺序 是 递减 顺序 ; 而 {3 1 2} 是 不 合法 的 ,因为 在 3 后 面 的 数字 {1 2} 是 一 个 递 
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增 的 顺序 。 


对 于 每 一 个 数 来 说 ,必须 进 栈 一 次 ,出 栈 一 次 。 定 义 进 栈 操作 为 0、 出 栈 操作 为 1。n 个 


数 的 所 有 状态 对 应 n 个 0 和 个 1 组 成 的 序列 。 出 栈 序列 , 即 要 求 进 栈 的 操作 数 大 于 等 于 


出 栈 的 操作 数 。 问 题 转化 为 由 nn 个 1 入 个 0 组 成 的 2n 位 二 进 制 数 ,任意 前 & 个 序列 中 0 


的 数量 大 于 或 等 于 1 的 数量 。 结 果 仍 然 是 Catalan 数 。 


hdu 1023 题 ; 火车 进 站 、 出 站 ,模拟 进 栈 和 出 栈 操作 。 由 于 要 计算 第 100 个 Catalan 数 ， 


这 个 数 非常 大 ,需要 用 大 数 计算 ,读者 可 以 用 Java 编程 。 
5) 二 叉 树 问题 
nn 个 结 点 构成 的 二 叉 树 共有 多 少 种 情况 ? 


例如 有 3 个 结 点 (图 中 的 黑 点 ) 的 二 叉 树 ,可 以 构成 5 种 二 叉 树 ,如 图 8. 2 所 示 。 


公 入 你 


图 8.2 包括 3 个 结 点 的 二 叉 树 
这 个 问题 符合 模型 |: 


CCoC-i 十 CC 十 二 十 CC 十 CriCo WG: Co 一 1 


其 含义 如 下 : 
-1: 右 子 树 有 0 个 结 点 十 左 子 树 有 nn 一 1 个 结 点 
-2: 布 子 树 有 1 个 结 点 十 左 子 树 有 n 一 2 个 结 点 ; 


C,-iCo : 右 子 树 有 ?一 1 个 结 点 十 左 子 树 有 0 个 结 点 。 
读者 可 以 练习 hdu 1130/3240 题 。 

6) 其 他 问题 

买 票 找 零 问题 。 


三 角 前 分 问题 : 把 一 个 凸 多 边 形 内 部 划分 成 多 个 三 角形 有 多 少 种 方法 ? 


7) 编程 计算 Catalan 数 
有 多 种 计算 方法 : 
(一 人 CC 一 6...; 


—4n—2 
| 


iE a £2 | 
Ry c- 二 人 (2z 十 1)121 


(2) Cn 


Ci-is Co 一 1 


Co 一 1 


从 公式 (2) 可 知 , 当 n 很 大 时 ,C,/C,-1 守 4。 所 以 Catalan 数 是 以 约 血 递增 的 ,增长 极 快 。 


这 3 个 公式 的 应 用 场合 不 同 。 


用 公式 (1) 的 场合 : 需要 输出 Catalan 数 的 值 。 此 时 n 较 小 ,例如 算 n 三 100 内 的 
Catalan 数 ,不 过 Catalan 数 仍然 是 一 个 超级 大 的 数 。 此 时 用 公式 (1) 比 用 公式 (2) 好 。 因 为 


公式 (2) 需 要 算 大 数 的 乘 /除法 , 它 比 公式 (1) 的 递 推 公式 更 容易 溢出 。 


例如 hdu 2067 题 “ 小 
让 本 天 下 
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免 的 棋盘 ”, 读 者 可 以 分 别 用 两 种 方法 编程 。 可 以 发 现 ,如 果 只 是 简单 地 用 int64 来 定义 
Catalan 数 , 当 计算 到 第 34 个 Catalan 数 时 公式 (2) 计 算出 错 ,而 公式 (1) 仍 然 正确 。 对 于 更 
大 的 Catalan 数 ,需要 进行 高 精度 计算 ,例如 hdu 1023/1130 题 ,计算 第 100 个 Catalan 数 。 

用 公式 (2)、(3) 的 场合 : n 非常 大 ,不 能 直接 输出 Catalan 数 , 而 是 做 取 模 操作 。 例 如 
hdu 5184 ,需要 算 第 10 万 个 Catalan 数 ,用 公式 (1) 算 太 慢 了 。 此 时 用 公式 (2) 是 很 好 的 选 
择 。 不 过 ,(2) 和 (3) 都 有 大 数 除法 ,对 大 数 做 除法 会 损失 精度 ,所 以 需要 转换 为 逆 元 ,然后 再 
取 模 。 如 果 用 公式 (3) 算 ,注意 先 预 计算 ”的 阶乘 ( 算 阶 乘 的 同时 对 阶乘 取 模 ) ,然后 再 用 公 
式 计算 。 


【习题 】 


除了 上 面 的 基础 题 外 ,读者 可 练习 下 面 的 题目 : 

hdu 4828 ,卡特 兰 数 , 逆 元 。 

hdu 5673 ,卡特 兰 数 , 逆 元 。 

hdu 5177,n 寺 10* 的 卡特 兰 数 。 

2. Stirling 数 

Stirling 数 也 是 解决 特定 组 合 问题 的 数学 工具 ,包括 两 种 , 即 第 一 类 Stirling 数 和 第 二 
类 Stirling 数 , 它 们 有 相似 的 地 方 。 

首先 通过 一 个 经 典 的 仓库 钥匙 问题 来 了 解 第 一 类 Stirling 数 。 

问题 描述 : 及 个 仓库 ,每 个 仓库 有 两 把 钥匙 , 共 2n 把 钥匙 ,有 位 保管 员 。 

问题 1: 如 何 放 钥 匙 使 得 保管 员 都 能 够 打开 所 有 仓库 ? 

问题 2: 保管 员 分 别 属 于 个 不 同 的 部 ,部 中 的 保管 员 数 量 和 他 们 管理 的 仓库 数量 一 样 
多 ,例如 第 i 个 部 有 m 个 管理 员 , 管 m 个 仓库 。 如 何 放 钥 匙 ,使 得 同 部 的 所 有 保管 员 能 打开 
本 部 的 所 有 仓库 ,但 是 无 法 打开 其 他 的 仓库 ? 

问题 1 很 好 解答 。1 号 仓库 放 2 号 仓库 的 钥匙 ,2 号 仓库 放 3 号 仓库 的 钥匙 , 依 此 类 推 ， 
n 号 仓库 放 1 号 仓库 的 钥匙 ,相当 于 nn 个 仓库 形成 了 一 个 闭环 的 圆 ; 然后 每 个 保管 员 拿 一 把 
钥匙 即 可 ,他 打开 一 个 仓库 后 就 能 拿 到 下 一 把 钥匙 ,继续 打开 其 他 所 有 的 仓库 。 

问题 2 是 问题 1 的 扩展 : 把 个 仓库 分 成 个 圆 排列 ,每 个 圆 内 部 按 问题 1 处 理 。 这 
里 的 麻烦 问题 是 : 把 个 仓库 分 配 到 k 个 圆 里 ,不 能 有 空 的 圆 , 共 有 多 少 种 分 法 ? 答案 就 是 
第 一 类 Stirling 数 。 

1) 第 一 类 Stirling 数 

定义 第 一 类 Stirling 数 s(n,k): 把 个 不 同 的 元 素 分 配 到 k 个 圆 排列 里 , 圆 不 能 为 空 。 
问 有 多 少 种 分 法 ? 

下 面 直接 给 出 第 一 类 Stirling 数 的 递 推 公式 ?; 

s(nsk) = s(n—1k—1)+(n—1)s(n—1k), l<k<n 
so = ly EON= 0 TE 


@ 《组 合 数学 ),Richard A. Brualdi 著 , 机 械 工业 出 版 社 。 第 8 章 ,定理 8. 2. 9, 推 导 了 第 一 类 Stirling 数 的 递 推 
公式 。 
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根据 递 推 公式 计算 部 分 Stirling 数 , 如 表 8.4 所 示 。 


表 8.4 第 一 类 Stirling 数 s(n,k) 的 值 


k 
0 1 2 3 4 5 6 
n 
0 1 
1 0 1 
2 0 
3 0 2 3 1 
4 0 6 11 6 1 
5 0 24 50 35 10 
6 0 120 274 225 85 15 1 
例如 : 


s(2,1) 二 1, 两 个 物体 ab 放 在 1 个 圆圈 里 ,有 1 种 方案 , 即 {(ab)}; 


5(3,1) 一 2,3 个 


物体 a、b、c 放 在 1 个 圆圈 里 ,有 两 种 方案 , 即 {(abc)} 和 { (acb)); 


s(3,2) 二 3,3 个 物体 a、.b、c 放 在 两 个 圆圈 里 ,有 3 种 方案 , 即 {(ab),(c)}、{(ac),b}、 


{(a),(bc) } 。 


2) 第 二 类 Stirling 数 
定义 第 二 类 Stirling 数 SCn,k): 把 个 不 同 的 球 分 配 到 k 个 相同 的 盒子 里 @ ,不 能 有 空 
盒子 。 问 有 多 少 种 分 法 ? 


SG) 的 递 推 双 


S( 
S( 


N 式 如 下 : 


nsk) = kS(n—1,k)++S(n—1,k—1), l<k<n 
0,0)=1, S$S(i,0)=0, 1l<i<n 


根据 递 推 公式 计算 部 分 Stirling 数 , 如 表 8. 5 所 示 。 
表 8.5 第 二 类 Stirling 数 S(n,k) 的 值 


0 1 

1 0 

2 0 1 

3 0 . 3 1 

4 0 7 6 td 

5 0 1 15 25 10 1 

6 0 1 31 90 65 15 1 


@ 读者 自然 能 想到 ， 


根据 球 是 否 一 样 . 盒 子 是 否 相 同 、 盒 子 是 否 可 为 空 可 以 组 合成 各 种 类 似 的 问题 ,例如 把 个 一 


样 的 球 分 配 到 个 相同 的 盒子 里 、 把 个 一 样 的 球 分 配 到 k 个 不 同 的 盒子 里 ,等 等 。 在 这 些 问题 中 ,第 二 类 Stirling 数 比 


较 复杂 ,但 它 是 很 基本 的 问 


题 。 所 有 的 情况 参考 (应 用 组 合 数学 ),Fred S. Roberts、Barry Tesman 著 , 冯 速 译 , 机 械 工 业 出 


版 社 ,2. 10 节 , 分 装 问题 ; 公式 的 推导 见 5. 5.3 节 。 
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例如 : 

S(2,1) 二 1, 两 个 球 ab 放 在 1 个 盒子 里 ,有 1 种 方案 , 即 {(ab) }; 

S(3,1) 王 1,3 个 球 ab.c 放 在 1 个 盒子 里 ,有 1 种 方案 , 即 {(abc)}; 

S(3,2) 王 3,3 个 球 ab.c 放 在 两 个 相同 的 盒子 里 ,有 3 种 方案 , 即 {(ab),(c))、{(ac)， 
b} 、{(a),(bc) } 。 


【习题 】 


hdu 4372“Count the Buildings”, 第 一 类 Stirling 数 。 
hdu 2643“Rank”, 第 二 类 Stirling 数 。 


8.4 概率 和 数学 期 望 


概率 和 数学 期 望 是 概率 论 和 统计 学 中 的 数学 概念 。 设 有 随机 变量 X ,出 现 取 值 x; 的 概 
率 是 p;, 把 它们 的 乘积 之 和 称 为 数学 期 望 (Expected Value, 或 者 均值 mean), 记 为 E(X): 


n 


E(X) = Dzip: 


i=1 

E(X) 是 基本 的 数学 特征 之 一 , 它 反映 了 随机 变量 平均 值 的 大 小 。 

以 妇女 的 生育 率 为 例 ,假设 某国 有 2000 万 个 育龄 妇女 ,不 生育 妇女 有 277 万 ,一 孩 724 
万 ,二 孩 883 万 ,三 孩 116 万 。 记 一 个 妇女 的 孩子 数量 是 X, 取 值 0、1、2、3, 概 率 分 别 是 277/ 
2000 二 0. 1385、724/2000 二 0. 362、883/2000 王 0. 4415、116/2000 二 0.058。 那 么 平均 每 个 妇 
女生 育 的 孩子 数量 如 下 : 

E(X) = 0X0.1385+1X0.362+2X0.4415 二 3X0.058 一 1.419 

数学 期 望 具有 线性 性 质 。 有 限 个 随机 变量 之 和 的 数学 期 望 等 于 每 个 变量 的 数学 期 望 

之 和 : 
E(X+Y) = E(X) + E(Y) 

竞赛 中 求 数学 期 望 的 题目 一 般 都 会 用 到 它 的 线性 性 质 。 由 于 线性 性 质 和 DP 的 状态 转 
移 思 想 很 相似 ,所 以 常常 用 DP 来 实现 。 

1. 例题 1 

首先 看 一 个 简单 的 例题 。 


poj 2096“Collecting Bugs” 
一 个 软件 有 :个子 系 统 , 会 产生 nn 种 bug。 现 在 要 找 出 所 有 种 类 的 bug。 假 设 某 人 
一 天 发 现 一 个 bug。 一 个 bug 属于 某 个 子 系统 的 概率 是 1/s, 属 于 某 种 分 类 的 概率 是 
1/n。 问 发 现 nn 种 bug, 且 每 个 子 系统 都 发 现 bug 的 天 数 的 期 望 。0 二 n,s 二 1000。 
输入 :nn 和 5s; 
输出 : 数学 期 望 。 
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LL 
输出 样 例 : 
3. 0000 


定义 状态 dp[ 门 [ 门 , 它 表示 已 经 找到 i 种 bug, 并 存在 于 j 个 子 系统 中 ,要 达到 目标 状态 
还 需要 的 期 望 天 数 。 其 中 ,dp[nj[s] 表 示 已 经 找到 种 bug, 且 存在 于 ;个 子 系统 ,说 明 已 经 
达到 了 目标 ,还 需要 0 天 ,所 以 dp[nj[sj 二 0。 从 dp[nj[sj 倒 推 回 dpL0]Lo] ,就 是 本 题 的 答 
案 , 即 还 没有 找到 任何 bug 的 情况 下 到 达 dpLnj[sj 时 需要 的 期 望 天 数 。 

从 dp[ 可 [7 门 开始 : 后 面 1 天 找到 1 个 bug, 可 能 有 以 下 4 种 情况 。 

(1) dp[i][ 门 : 发 现 一 个 bug, 属 于 已 经 有 的 i 个 分 类 和 j 个 系统 ,概率 为 p1 一 (i/z) * 
(/s)。 这 一 天 相当 于 浪费 了 。 

(2) dp[i 十 1J[;j: 发 现 一 个 bug, 不 属于 已 有 分 类 、 属 于 已 有 系统 ,概率 为 p2 一 (1 一 太 / 
n) * (j/s)。 

(3) dp[ 站 [十 1]: 发 现 一 个 bug, 属 于 已 有 分 类 、 不 属于 已 有 系统 ,概率 为 p3== (i/n) x 
,0 A 

(4) dp[i 十 1J[j 十 1]: 发 现 一 个 bug, 不 属于 已 有 系统 .不 属于 已 有 分 类 ,概率 p4 二 (1 一 
i/n) * (1—j/s)。 

可 以 验证 : pl 十 p2 十 p3 十 p4 二 1。 

状态 转移 方程 如 下 : 

dp[i][j] =pl * dp[ijJ[jj+p2* dp[i 十 1][ 站 十 p3* dp[ 疏 Gj 十 1 十 
p4*dp[i 十 1][j 十 1] 十 1 // 末 尾 加 上 1 天 
整理 得 到 : 
dp[i][j] =(p2* dp[i 十 1J[ 门 十 p3x* dp[ 疏 Gj 十 1] 十 p4*dp[i 十 1JCj 十 1j 十 DD/(1 一 p1) 
=nx*st+n—ix*jx*dp[Lit1j[jj+ix(s—7)*dp[ij[j 十 1 十 
(nan—D%(—7 i 二 1 +1]) /ns—ixj) 
在 写 程序 时 ,从 dp[nj[s] 倒 推 到 dp[0][o],dp[o][o] 就 是 答案 。 


poj 2096 部 分 程序 


cin>n>s; 
for (int i = n; i>=0; i--) 
zor Vit md 


if(i==n5j==s) 
dp[n][s] = 0.0; 
else 


dp[i][j]= (nx*st+(n-i)x*j*dp[i+1][j] +ix*(s-j)*dp[i][j+1] 
+(n-i)x*(s-j)x*dp[li+1][j+1]) /(n* s—ix*j); 
} 


2. 例题 2 
hdu 4035 是 经 典 的 迷宫 概率 问题 ,综合 了 图 、 数 学 期 望 .DP 等 内 容 。 
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hdu 4035“Maze” 
一 个 迷宫 有 守 个 房间 ,用 7 一 1 条 隧道 连通 起 来 。 每 个 房间 里 都 有 陷阱 和 和 逃生 口 。 
某 人 的 起 点 在 房间 1 ,在 每 个 房间 都 有 3 种 可 能 : 
(1) 落 入 陷阱 被 杀 死 , 回 到 房间 1 ,概率 为 及; 
(2) 找到 逃生 口 ,走出 迷宫 ,概率 为 ci; 
(3) 在 该 房间 连接 的 隧道 中 随机 走 一 条 ,进入 下 一 个 房间 。 
求 逃 出 迷宫 所 要 走 的 隧道 数量 的 期 望 值 。 


首先 分 析 这 个 迷宫 , 它 是 一 棵 树 。 

一 个 有 nn 个 点 .n 一 1 条 边 的 无 向 连通 图 ,图 上 肯定 没有 回路 ,这样 的 图 是 一 棵 树 。 证 明 
如 下 : 用 反 证 法 ,假设 有 一 个 回路 ,那么 在 这 个 回路 上 可 以 删除 一 条 边 而 不 影响 整体 的 连 
通 ; 删除 之 后 ,还 及 个 点 .n 一 2 条 边 ,这 是 不 可 能 连通 的 。 

要 使 有 nn 个 点 的 图 是 连通 的 ,至 少 需 要 n 一 1 条 边 。 生 成 一 个 连通 图 ,可 以 用 扩大 路 径 
法 ,从 一 个 点 开始 ,每 加 入 一 个 新 的 点 ,至 少 需 要 一 条 边 来 连接 ,所 以 个 点 至 少 需要 nn 一 1 
条 边 才能 连通 。 

下 面 是 推导 过 程 和 编程 思路 。 

1) 定义 DP 状态 E[ 门 

在 结 点 i 处 , 逃 出 迷宫 所 要 走 的 边 数 的 期 望 。 


EL1] 就 是 所 求 的 答案 。 
根据 树 的 特点 ,分 析 E[ 站 : 
i 是 叶子 结 点 , 即 i 没有 子 结 点 。 在 结 点 i 有 3 种 情况 , 即 被 杀 . 逃 出 、 回 到 父 结 点 。 
E[i] = kx* E[1]+e;*0+ (1—ki—e)* (ELfather[ijj+1) (8-1) 
i 是 非 叶子 结 点 , 设 i 连接 的 边 数 是 m, 有 3 种 情况 , 即 被 杀 ` 逃 出 、 转 到 其 他 结 点 。 
E[i] = k; * E[1]+e;*0+ (1—k;—e)/m* (ELfather[i]j 十 1 十 2 (ELchild[]] 二 了 D3 
(8-2) 
2) 计算 过 程 
设 对 于 每 个 结 点 : 


E[i] = A; * E[1]+ B;* E[Lfather[i]]+ CG; 
目标 是 求 E[1],E[1]=Ai * ELI] 十 B,*0 十 Ci, 即 EL] 一 Ci/(GI 一 A,)。 
在 叶子 结 点 上 有 : 


在 非 叶子 结 点 上 , 设 为 ; 的 子 结 点 , 则 | 
BD ELehild[iID) = BEC 
= >) (A;* EL1]+ B;* ELfather[j]] + C;) 
= >) (A;* EL1]+B;* ECLi]+ GC) 


= 182。 


代入 式 (8-1) 和 式 (8-2) 中 ,消去 EL[child[i]] 和 ELfather[j]], 可 以 得 到 非 叶子 结 点 的 
A;、B;、C; 的 表达 式 。 
3) 编程 思路 


从 上 面 的 推导 过 程 可 知 ,计算 过 程 是 从 叶子 结 点 开始 算 , 再 算 它 们 的 父 结 点 ,直到 算出 
根 结 点 的 Al 、Bi、C ,得 到 EL1]。 在 编程 时 ,需要 按 从 叶子 结 点 到 根 结 点 的 顺序 遍历 每 

这 个 过 程 用 DFS 编程 是 最 合适 的 。 从 根 结 点 1 出 发 ,用 DFS 遍历 整 棵 树 ; DFS 到 最 底 
层 的 叶子 结 点 时 ,计算 叶子 结 点 的 A、Bi、Ci, 然 后 逐步 回 退 ,再 计算 非 叶 子 结 点 的 A,、 
Gas 

在 题目 中 ,图 的 规模 n<10 000, 需 要 用 邻接 表 存 储 。 请 读者 在 学 习 第 10 章 的 相关 内 容 
后 再 回头 做 这 一 题 。 


【习题 】 


hdu 3853“LOOPS”, 基 础 题 。 

hdu 4405“Aeroplane chess”, 简 单 题 。 

poj 3071“Football”, 简 单 概 率 DP。 

poj 3744“Scout YYF I" ,用 矩阵 优化 求 概 率 。 

hdu 4089“Activation”,2011 年 北京 区 域 赛 题目 ,概率 DP., 较 难 。 


本 节 讨 论 的 公平 组 合 游戏 (Impartial Combinatorial Game,1CG)0 是 满足 
以 下 特征 的 一 类 问题 : 

(1) 有 两 个 玩家 ,游戏 规则 对 两 人 是 公平 的 ; 

(2) 游戏 的 状态 有 限 ,能 走 的 步 数 也 有 限 ; 

(3) 两 人 轮流 走 步 , 当 一 个 玩家 不 能 走 步 时 游戏 结束 ; 

(4) 游戏 的 局 势 不 能 区 分 玩家 身份 , 像 围 棋 这 样 有 黑 、 白 两 方 的 游戏 就 不 属于 此 类 
问题 。 

ICG 问题 有 一 个 特征 : 给 定 初始 局 势 ,并 且 指 定 先 手 玩家 ,如 果 双 方 都 采取 最 优 策略 ， 
那么 获胜 者 就 已 经 确定 了 。 也 就 是 说 ,ICG 问题 存在 必 胜 策略 。 

本 节 讲 解 ICG 问题 的 必 胜 策略 ,有 关 的 知识 点 有 P-position、N-position、Nim Game、 
Sprague-Grundy 函数 、 威 佐 夫 游戏 等 。ICG 很 早 就 得 到 了 研究 .例如 对 于 Nim Game 问题 ， 
1902 年 C. Bouton 在 一 本 著作 中 进行 了 分 析 ; 对 于 Sprague-Grundy 函数 ,由 数学 家 
Grundy 和 Sprague 在 1930 年 分 别 独立 发 现 。 


四 ”在 算法 竞赛 中 ,常常 称 这 类 问题 是 “博弈 论 ” 问 题 。 虽 然 Nim Game、Sprague-Grundy 函数 也 属于 博弈 论 的 范畴 ， 
不 过 在 普通 的 博弈 论 教材 中 并 不 能 找到 有 关内 容 。 在 一 些 应 用 组 合 数学 书 中 会 提 到 有 关 知 识 , 请 参考 (应 用 组 合 数学 )， 
Alan Tucker 著 , 冯 速 译 ,人 民 邮 电 出 版 社 ,第 11 章 。 
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Sprague-Grundy 函数 是 本 节 最 重要 的 内 容 。 


8:9a1 


巴 什 游戏 与 


与 P-position N-position 


首先 给 出 一 个 简单 的 例题 。 小 学 奥数 中 有 这 样 的 题目 。 
1. 巴 什 游戏 (Bash Game) 


的 人 


有 nn 颗 石 子 , 甲 先 取 , 乙 后 取 , 每 次 可 以 拿 1 一 m 颗 石 子 , 轮 流 拿 下 去 , 拿 到 最 后 一 颗 


获胜 。 


输入 : n 和 m,1 二 n,m 三 1000。 
输出 : 如 果 先 拿 的 甲 赢 了 ,输出 "first" ,否则 输出 "second"。 


hdu 1846“Brave Game” 


程序 非常 简单 ,车 n%(m 十 1) 二 = 二 0, 则 先 手 败 ,否则 先 手 胜 。 


cin> n>m; 
if(n % (m+1) == 0) printf("second\n"); 


else 


printf("first\n"); 


分 析 如 下 : 
(1) 当 n<m 时 ,由 于 一 次 最 少 拿 1 个 .最 多 拿 六 个 , 甲 可 以 一 次 拿 完 , 先 手 赢 。 


(2) 当 7 一 六 十 1 时 


,无 论 甲 拿 走 多 少 个 (1~m 个 ), 剩 下 的 都 多 于 1 个 \ 少 于 等 于 m 个 ， 


乙 都 能 一 次 拿 走 剩余 的 石子 ,后 手 取 胜 。 


上 


拿 m 十 1 一 k 个 ,使 得 剩 


定 赢 。 
( 


2. 


上 面 两 种 情况 可 以 扩展 为 以 下 两 种 情况 : 


工 ) 如果 n%(m 十 1)==0, 即 nn 是 mm 十 1 的 整数 们 ,那么 不 管 甲 拿 多 少 , 例 如 个 , 乙 都 


下 的 永远 是 mw 十 1 的 整数 们 ,直到 最 后 的 m 十 1 个 ,所 以 后 拿 的 乙 一 


如 果 n%(m 十 DD)1==0, 即 不 是 mw 十 1 的 整数 倍 , 还 有 余数 ~, 那么 甲 拿 走 ~ 个 , 剩 
下 的 是 m 十 1 的 倍数 ,这 样 就 转移 到 了 情况 ( I) ,相当 于 甲乙 互 换 , 结 果 是 甲 赢 。 

在 这 个 拿 石子 的 游戏 里 ,对 于 后 拿 的 乙 来 说 是 很 不 利 的 ,只 有 在 n%(m 十 1) 二 0 的 情况 
下 乙 才 能 赢 ,在 其 他 情况 下 都 是 甲 赢 。 
P-position .N-position 与 动态 规划 

上 面 对 巴 什 游戏 的 解答 虽然 很 好 理解 ,但 是 如 果 稍 作 扩展 ,就 不 那么 容易 了 。 例 如 取石 
子 的 数量 ,不 是 1~~m 内 的 连续 数字 ,而 是 只 能 在 {a ,as,…,ai) 中 选 。 对 于 此 类 问题 ,有 必 
要 研究 一 种 通用 的 方法 。 

定义 P-position 为 前 一 个 玩家 (Previous Player, 即 刚 走 过 一 步 的 玩家 ) 的 必 胜 位 置 、`N- 
position 为 下 一 个 玩家 (Next Player) 的 必 胜 位 置 。 

当前 状态 是 N-position ,表示 马上 走 下 一 步 的 先 手 必 胜 ; P-position 表示 先 手 必 败 。 

设 只 能 拿 数 量 为 11,4} 的 石头 。 在 表 8.6 中 ,zx 是 石头 的 数量 ,pos 是 对 应 的 position 。 
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表 8.6 只 能 拿 数 量 为 {1,4} 的 石头 


表 中 的 pos 是 这 样 计算 的 : 

(1) z=0,1,2,3,4 时 ,pos 二 P,N,P,N,N。 特别 注意 z=0, 即 没有 石头 的 情况 ,可 以 看 
成 下 一 个 玩家 ( 先 手 玩家 ) 没 有 石头 可 拿 , 输 了 ,pos 王 P。z=1 时 , 先 手 玩家 必 启 ,pos 二 N。 
Zz 一 2 时 , 先 手 只 能 拿 1 个 ,后 手 拿 剩 下 的 1 个 ,后 手 赢 ,pos 一 P。 

(2) z= 二 5 时 分 两 种 情况 : 如 果 先 手 玩家 拿 1 个 ,退回 到 z= 一 5 一 1 一 4 的 情况 ,此 时 后 手 
玩家 处 于 N, 即 后 手 处 于 赢 的 位 置 ; 如 果 先 手 拿 4 个 ,退回 到 z 一 5 一 4 一 1 的 情况 ,此 时 后 手 
仍然 处 于 N。 在 两 种 情况 下 后 手 都 赢 了 。 所 以 x 二 5 时 ,pos 一 P, 即 先 手 必 输 。 

(3) z==6 时 ,分 别 退 回 到 z=6 一 1=5 和 xz=6 一 4 一 2 的 情况 ,后 手 都 处 于 P。 在 两 种 情 
况 下 ,后 手 都 输 了 。 所 以 x=6 时 pos=N, 先 手 必 赢 。 

(4) zx 一 7 时 略 。 

(5) z 一 8 时 : 退回 到 z 一 8 一 1 一 7, 后 手 处 于 P; 退回 到 z 一 8 一 4 一 4, 后 手 处 于 N。 在 
后 手 有 输 有 赢 的 情况 下 , 先 手 肯 定 选 让 对 方 必 败 的 方案 ,所 以 zx 一 8 时 pos 一 N。 

可 以 观察 到 pos 值 是 周期 性 变化 的 ,周期 为 5。 

下 面 再 举 一 个 例子 , 设 只 能 拿 数量 为 {1,3,4} 的 石头 ,请 读者 验证 表 8.7。 


表 8.7 只 能 拿 数量 为 {1,3,4} 的 石头 


pos 仍然 是 周期 变化 的 ,周期 是 7。 

上 面 的 计算 过 程 符合 动态 规划 的 思路 。 在 编程 时 可 以 用 动态 规划 ,也 可 以 直接 按 周 期 
性 变化 规律 做 求 余 计算 ,hdu 1846 是 一 种 最 简单 的 情况 ,用 求 余 编程 计算 就 可 以 了 。 

巴 什 游戏 有 一 些 变形 。 例 如 hdu 2147“kiki's game”, 给 出 一 个 nXm 的 矩阵 ,从 右上 和 角 
走 到 左下 角 ,看 谁 先 到 终点 。 画 出 P-N 图 ,找到 规律 即 可 。 


8.5.2 尼 姆 游戏 


巴 什 游戏 只 有 一 堆 石 头 , 如 果 扩展 到 多 堆 石 头 ,情况 将 复杂 得 多 ,这 就 是 尼 姆 游戏 (Nim 
Game)@。 

尼 姆 游戏 的 规则 : 及 堆 石 子 ,数量 分 别 是 {a ,az ,a3，,…,a,) ,两 个 玩家 轮流 拿 石子 ,每 
次 从 任意 一 堆 中 拿 走 任意 数量 的 石子 , 拿 到 最 后 一 个 石子 的 玩家 获胜 。 

以 3 堆 石 头 为 例 ,简单 情况 的 胜 负 如 下 。 

{0,0,0}、{0,1,1}、{0,k,k}: 先 手 必 败 。 

{1,1,1}、{1,1,2}、{1,1,3}: 先 手 必 胜 。 


® https://en. wikipedia. org/wiki/Nim. 
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对 于 任意 的 {a ,az ,as，…,as), 尼 姆 游戏 有 一 个 极为 简单 的 判断 胜 负 的 方法 , 即 做 异 或 
运算 。 
定理 8.1: 
若 a1 外 as 晤 as 外 … 外 a, 关 0, 则 先 手 必 胜 , 记 此 时 的 状态 为 N-position; 
车 a 名 a 外 a; 田 … 旬 a 一 0, 则 先 手 必 败 , 记 此 时 的 状态 为 P-position。 
例如 3 堆 石 头 的 数量 分 别 是 {5,7,9} ,转化 为 二 进 制 数 后 做 异 或 运算 ,结果 如 下 : 
0101 
0111 
1001 


1011 


异 或 运算 的 结果 不 等 于 0, 先 手 必 胜 。 

在 数学 中 ,二 进 制 的 异 或 运算 也 可 以 看 成 是 统计 每 一 位 上 1 的 总 个 数 的 奇偶 性 : 如 果 
这 一 位 上 有 偶数 个 1, 那么 这 一 位 的 计算 结果 为 0; 如 果 有 奇数 个 ,计算 结果 为 1。 所 以 , 尼 
姆 游戏 中 的 异 或 运算 也 被 称 为 Nim-sum 运算 。 

下 面 对 定 理 8. 1 做 简单 的 证 明 。 

(1) 必定 能 够 从 N-position 转化 到 P-position。 也 就 是 说 , 先 手 处 于 必 胜 点 N-position 
时 可 以 拿 走 一 些 石子 ,让 后 手 必 败 。 读 者 可 以 先 自己 思考 如 何 转化 。 下 面 是 具体 方法 : 任 
选 一 堆 , 例 如 第 ; 堆 ,石头 数量 是 &; 对 剩 下 的 n 一 1 堆 做 异 或 运算 , 设 结果 为 五; 如 果 互 比 
& 小 ,就 把 第 守 堆 石头 减少 到 五; 这 样 操作 之 后 ,因为 万 四 互 =0, 所 以 半 堆 石头 的 异 或 等 于 
0。 可 以 证 明 ,总 会 存在 这 样 的 第 ;站 堆 石 头 ,而 且 可 能 有 多 种 转化 方案 。 下 面 例题 hdu 1850 
的 程序 中 的 “if((sum ^aLi])< 王 a[ 训 )” 统 计 了 所 有 方案 。 

(2) 进入 P-position 后 , 轮 到 的 下 一 个 玩家 ,不 管 拿 多 少 石子 都 会 转移 到 N-position 。 
因为 任何 一 堆 的 数量 变化 ,都 会 使 得 这 一 堆 的 二 进 制 数 至 少 有 一 位 发 生变 化 ,导致 异 或 运算 
的 结果 不 等 于 0。 也 就 是 说 ,这 一 个 玩家 不 管 怎么 拿 石 子 都 必 败 。 

(3) 在 游戏 过 程 中 , 按 上 述 (1) 和 (2) 的 步骤 在 N-position 和 P-position 之 间 交 替 转 化 ， 
直到 所 有 堆 的 石头 都 是 0, 即 终止 于 P-position 。 

上 述 证 明 过 程 也 说 明了 玩家 该 如 何 进行 游戏 。 


hdu 1850 “Being a Good Boy in Spring Festival” 
两 人 小 游戏 : 桌子 上 及 n 堆 扑克 上牌 ; 每 堆 牌 的 数量 分 别 为 ui; 两 人 轮流 进行 ; 每 走 
一 步 可 以 从 任意 一 堆 中 取 走 任意 张 牌 ; 桌子 上 的 扑克 牌 全 部 取 光 , 则 游戏 结束 ; 最 后 一 
次 取 牌 的 人 为 胜 者 。 问 先 手 的 人 如 果 想 赢 ,第 一 步 有 几 种 选择 ? 
输入 ; n 表示 扑克 有 牌 的 堆 数 ; a;(i 二 1 一 n) 表 示 每 堆 扑 克 牌 的 数量 。 
输出 : 如 果 先 手 能 赢 , 输 出 他 第 一 步 可 行 的 方案 数 ,否则 输出 0。 


主要 代码 如 下 : 
int sum= 0, ans= 0; //sun 是 Nim- sum,ans 是 第 一 步 可 行 的 方案 数 
for(int i=0; i<n; i++) sum^= a[i]; // 异 或 计算 , 求 Nim- sum 
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if(sum==0) cout<<0<<endl; // 开 始 局 面 是 P- position, 先 手 必 败 
else{ // 开 始 局 面 是 N- position, 先 手 胜 
for(int i=0; i<n; i++) 
if((sum“a[li]) <=a[li]) // 计 算 第 一 步 所 有 的 可 能 方案 
anst+; 


cout << ans << endl; 


, 


程序 中 的 “if((sum “a[ 记 ) < 二 a[ 记 )” 计 算 第 一 步 的 方案 数 , 它 利用 了 异 或 运算 的 原理 : 
A@B@B 二 A。 设 日 等 于 除了 a[ 门 之 外 其 他 所 有 数 的 异 或 ,有 : 
sum = H^a[i] 
sum"*a[li] = H*a[li]j “a[li] = H 
所 以 ,Csum “a[ 门 )< 二 a[ 门 就 是 HH < 二 a[ 疏 。 把 a[ 门 减少 到 互 , 就 是 一 种 可 行 的 方案 。 


8.5.3 图 游戏 与 Sprague-Grundy 函数 


前 面 讲解 的 巴 什 游戏 、 尼 姆 游戏 用 P-position 和 N-position 做 分 析 工 具 , 如 果 遇 到 更 复 
杂 的 游戏 ,很 难 分 析 。 有 一 种 高 级 的 分 析 方 法 , 即 Sprague-Grundy 函数 ,是 巴 什 游 戏 . 尼 姆 
游戏 这 类 问题 的 通用 方法 ,该 方法 用 图 作为 分 析 工 具 。 

图 游戏 的 规则 是 : 给 定 一 个 有 向 无 环 图 ,在 一 个 起 点 上 放 一 枚 棋子 ,两 个 玩家 交替 将 这 
枚 棋子 沿 有 向 边 进 行 移动 ,无 法 移动 者 判 负 。 图 是 有 向 无 环 图 的 ,不 会 有 环 路 ,保证 游戏 有 
终点 。 

像 巴 什 游戏 \ 尼 姆 游戏 这 样 的 ICG 问题 都 可 以 转化 为 基于 图 的 游戏 。 把 ICG 中 的 每 个 
局 势 看 成 图 上 的 一 个 结 点 ,在 每 个 局 势 和 它 的 后 继 局 势 之 间 连 一 条 有 向 边 ,就 抽象 成 了 图 游 
戏 。 下 面 给 出 图 游戏 的 严格 定义 。 

1. 图 游戏 


定义 : 一 个 有 向 无 环 图 G(X,F),X 是 点 (局 势 ) 的 非 空 集合 ,F 是 X 上 的 函数 ,对 于 
ZXEX, 有 F(zx)CX; 对 于 给 定 的 zxEX,F(Cz) 表 示 玩 家 从 工 出 发 能 够 移动 到 的 位 置 ; 如 果 
F(z) 为 空 ,说 明 无 法 继续 移动 , 称 zx 是 终点 位 置 。 

两 个 玩家 的 游戏 过 程 按 以 下 规则 进行 : 一 个 玩家 先 走 , 起 点 是 ze ,然后 两 人 交替 走 步 ; 
在 位 置 x, 玩 家 可 以 选择 移动 到 y 点 ,y€E F(x); 位 于 终点 位 置 的 玩家 , 判 负 。 

例如 在 巴 什 游 戏 中 , 设 一 次 可 以 拿 的 石头 是 {1,2}), 结 点 集合 是 X={0,1,2,…,n)。 
下 (0) 为 空 , 因 为 石子 数量 是 0, 已 经 到 达 终 点 ,无 法 再 转移 ; F(1) 二 {0} ,表示 从 1 可 以 转移 
到 0; F(2) 二 {0,1) ,表示 从 2 可 以 转移 到 0 或 1; 等 等 。 这 里 以 zx 一 6 为 例 画 出 游戏 图 ,如 
图 8.3 所 示 。 


图 8.3 巴 什 游戏 图 


图 8. 3 中 的 每 个 点 表示 一 个 可 能 的 局 势 , 箭 头 表 示 局 势 的 转移 方向 。 玩 家 的 所 有 步骤 
都 在 这 个 图 上 。 图 上 有 一 些 是 先 手 必 胜 点 CN-position) ,例如 1、2、4、5 等 ,以 及 先 手 必 败 点 


“UW 


算法 竞赛 入 门 到 进 阶 


(P-position) ,例如 3、6 等 。 确 定 了 这 些 关 键 的 点 ,就 能 得 到 解决 方案 。 

但 是 ,在 大 部 分 情况 下 游戏 图 是 很 复杂 的 ,例如 尼 姆 游戏 ,给 定 3 堆 石 头 15,7,9}) ,图 上 
的 每 个 点 是 一 个 局 势 ,如 {0,0,0}、{0,1,1) 等 ,可 能 的 局 势 有 6X8X10 二 480 个 ,点 与 点 之 间 
的 转移 关系 也 很 复杂 。 

利用 Sprague-Grundy 函数 这 个 工具 可 以 轻松 地 找到 这 些 关键 点 。 

2. Sprague-Grundy 函数 

定义 : 在 一 个 图 G(X ,FF) 中 ,把 结 点 zx 的 Sprague-Grundy 函数 定义 为 sgCz), 它 等 于 没 
有 指定 给 它 的 任意 后 继 结 点 的 sg 值 的 最 小 非 负 整数 。 

上 述 定义 有 些 擂 口 ,下 面 的 例子 清晰 地 说 明了 它 的 含义 。 图 8. 3 中 每 个 结 点 的 sg 值 如 
图 8.4 所 示 。 


图 8.4 结 点 zx 和 sg(z) 


当 z= 二 0 时 ,sg(0) 二 0, 因 为 结 点 0 没有 后 继 点 ,0 是 最 小 的 非 负 整数 ; 

当 zx 二 1 时 , 结 点 1 的 后 继 是 结 点 0, 由 于 sg(0) 二 0, 不 等 于 sg(0) 的 最 小 非 负 整 数 是 1， 
所 以 sg(1)=1; 

当 zx==2 时 , 结 点 2 的 后 继 是 结 点 0 和 1, 由 于 sg(0) 一 0、sg(1) 一 1, 不 等 于 sg(0) 和 
sg(1) 的 最 小 非 负 整数 是 2, 所 以 sg(2) 一 2; 

当 z=3 时 , 结 点 3 的 后 继 是 结 点 1 和 2, 由 于 sg(1) 王 1、.sg(2) 一 2, 不 等 于 sg(1) 和 
sg(2) 的 最 小 非 负 整数 是 0, 所 以 sg(3) 一 0; 

当 z= 二 4 时 , 结 点 4 的 后 继 是 结 点 2 和 3, 由 于 sg(2) 二 2、sg(3) 二 0, 不 等 于 sg(2) 和 
sg(3) 的 最 小 非 负 整数 是 1, 所 以 sg(4) 一 1; 

上 面 的 说 明 也 给 出 了 求 每 个 点 的 sg 值 的 过 程 ,和 前 面 提 到 的 用 动态 规划 思路 求 
P-position、N-position 的 过 程 差 不 多 ,复杂 度 是 O(nm) ,其 中 是 石子 数量 ,m 是 一 次 最 多 
可 拿 的 石子 数 。 

3. 用 Sprague-Grundy 函数 求解 巴 什 游戏 

在 只 有 一 堆 石 子 的 巴 什 游戏 中 ,以 下 判断 成 立 : 

sg(z) 一 0 的 结 点 工 是 必 败 点 , 即 P-position 点 。 

证 明 如 下 : 

(1) 根据 sg 函数 的 性 质 , 有 以 下 推论 : sg(z)=0 的 结 点 zx, 没有 sg 值 等 于 0 的 后 继 结 
点 ; sg(y) 二 0 的 任意 结 点 y, 必 有 一 条 边 通 向 sg 值 为 0 的 某 个 后 继 结 点 。 

(2) 如 果 sg(Cz)=0 的 结 点 工 是 图 上 的 终点 (没有 后 继 结 点 ,在 图 论 中 称 这 个 点 的 出 度 
为 0) ,显然 有 z 一 0:, 它 是 一 个 P-position 点 ; 如 果 工 有 后 继 结 点 ,那么 这 些 后 续 结 点 都 能 通 
向 某 个 sg 值 为 0 的 结 点 。 当 玩家 甲 处 于 sg(Cz)=0 的 结 点 时 , 它 只 能 转移 到 sg(x) 关 0 的 结 
点 ,下 一 个 玩家 乙 必 然 转移 到 sg(z) 王 0 的 点 ,从 而 再 次 让 甲 处 于 不 利 的 局 势 。 所 以 sg(x) 二 0 
.188 ， 


的 点 是 必 败 点 。 


仍然 以 hdu 1846 为 例 ,用 Sprague-Grundy 函数 的 方法 编程 实现 。 
hdu 1846 程序 (sg 函数 ) 


# include < bits/stdc++.h> 
using namespace std; 
const int MAX = 1001; 
int n, m, sg[MAX], s[MAX]; 
void getSG(){ 
memset(sg, 0, sizeof(sg)); 
for (int i=1; i<=n; i++){ 
memset(s, 0, sizeof(s)); 
for (int j=1; j<=m&&i-j>=0; j++) 


s[sg[i-j]] = 1; // 把 二 的 后 继 结 点 放 到 集合 s 中 


for (int j=0; j<=n; j++) // 计 算 sg[i] 
if(!s[j]){sg[i] = jy break;} 
} 
] 
int main(){ 
intc; cin>ce; 
while (c—- ){ 
cin>n>m; 
getSG( ); 
证 (sg[n]) cout<<"first\n"; //sg != 0, 先 手 胜 
else cout <<"second\n"; //sg == 0, 后 手 胜 
} 
return 0; 


] 


4. 用 Sprague-Grundy 函数 求解 尼 姆 游戏 


尼 姆 游戏 中 有 多 堆 石 头 , 也 可 以 用 Sprague-Grundy 函数 求解 。 其 步骤 如 下 : 


(1) 计算 每 一 堆 石 头 的 sg 值 ; 

(2) 求 所 有 石头 堆 的 sg 值 的 异 或 ,其 结论 是 : 

若 sg(Cz) 中 sg(zs) 中 sg(zs) 四 … 中 sg(zv) 天 0, 先 手 必 胜 ; 
若 sg(z)sg(z) 四 sg(zs) 田 …sg(Cz) 一 0, 先 手 必 败 。 


请 读者 根据 前 面 对 尼 姆 游戏 的 说 明 以 及 Sprague-Grundy 函数 的 特征 证 明 其 正确 性 。 


下 面 用 Sprague-Grundy 函数 求解 hdu 1848。 


hdu 1848 “ Fibonacci again and again” 


两 人 小 游戏 ,定义 如 下 : 一 共有 3 堆 石 子 , 数 量 分 别 是 mn、p; 两 人 轮流 走 ; 每 走 一 
步 可 以 选择 任意 一 堆 石子 , 然 后 取 走 了 个 ; 只 能 是 菲 波 那 契 数列 中 的 元 素 ( 即 每 次 只 
能 取 1、2、3、5、8 等 数量 ); 最 先 取 光 所 有 石子 的 人 为 胜 者 。 

输入 : 3 个 整数 mn、p(1 二 m,n,p 夺 1000),m 二 n 二 p 二 0 表示 输入 结束 。 

输出 : 如 果 先 手 的 人 能 赢 , 输 出 “Fibo” ,否则 输出 “Nacci”。 


这 一 题 属于 典型 的 尼 姆 游戏 ,程序 如 下 : 
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hdu 1848 程序 (sg 函数 ) 


# include <bits/stdc++.h> 
using namespace std; 
const int MAX = 1001; 
int sg[MAX], s[MAX]; 
int fibol13] = {1 2 3, S57 9 13,.21, 34, 357 89, 144, 233, 377, 610; 907}; 
void getSG(){ // 计 算 每 一 堆 的 sg 值 
for(int i=0;i<=MRX;i++){ 
sg[i]=i; 
memset(s, 0, sizeof(s)); 
for(int j=0; j<15 g&& fibo[j]<= i; j++){ 
s[sg[i- fibo[j]]] = 1; 
for(int j=0; j<=i; j++) 
if(!1s[j]) {sg[i] = j; break;} 
} 
} 
} 
int main(){ 
getSG() // 预 计算 sg 值 
int n,m,p; 
while(cin>n>>m>>p gg n+m+p){ 
if(sg[n]^sg[m]^sg[p]) cout << "Fibo" << endl; 
else cout << "Nacci"<< endl; 
} 


return 0; 


【习题 】 


hdu 1907“John”, 尼 姆 游戏 。 

hdu 2999 “Stone Game, Why are you always there?” ,sg 函数 。 
hdu 1524“A Chess Game”,sg 函数 。 

hdu 4111“Alice and Bob”,sg 函数 ,记忆 化 搜索 。 

hdu 4203“Doubloon Game” ,数据 规模 大 , 找 规律 。 


8.5.4 威 佐 夫 游戏 


威 佐 夫 游戏 (Wythoff's Game) 是 一 种 结论 非常 有 趣 的 游戏 ,其 原型 见 hdu 1527 的 
描述 。 


hdu 1527“ 取 石子 游戏 ” 
有 两 堆 石子 ,数量 任意 ,可 以 不 同 。 游 戏 开 始 由 两 个 人 轮流 取石 子 。 
游戏 规定 每 次 有 两 种 不 同 的 取 法 ,一 是 可 以 从 任意 的 一 堆 中 取 走 任意 多 的 石子 ; 二 
是 可 以 从 两 堆 中 同时 取 走 相同 数量 的 石子 。 最 后 把 石子 全 部 取 完 者 为 胜 者 。 
现在 给 出 初始 的 两 堆 石 子 的 数目 a 和 6b, 问 先 手 玩家 是 不 是 最 后 的 胜 者 ? 
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分 析 两 堆 石子 的 数量 (a,0) ,使 先 手 必 输 的 局 势 有 (0,0)、(1,2)、(3,5)、(4,7)、(6,10)、 
(8,13)、(9,15) ,等 等 , 称 这 些 局 势 为 "奇异 局 势 "9。 

观察 发 现 ,奇异 局 势 有 两 个 特征 : @ 差 值 是 递增 的 ,分 别 是 0,1,2,3,4,…:; @ 每 个 局 势 
的 第 一 个 值 是 未 在 前 面 出 现 过 的 最 小 的 自然 数 。 经 过 分 析 可 以 发 现 ,每 个 奇异 局 势 的 第 一 
个 值 总 是 等 于 这 个 局 势 的 差 值 乘 上 黄金 分 割 比例 1. 618 ,然后 取 整 。 

需要 注意 的 是 ,在 推导 奇异 局 势 时 用 到 的 黄金 分 割 数 需要 较 高 的 精度 ,直接 用 1. 618 这 
个 估 值 是 不 行 的 。 在 程序 中 ,用 以 下 公式 计算 高 精度 黄金 分 割 数 ， 


double gold= (1+ sqrt(5))/2; 
下 面 是 hdu 1527 的 代码 。 
hdu 1527 代码 


# include <bits/stdc++.h> 
using namespace std; 
int main(){ 
int n, m; 
double gold = (1 + sqrt(5))/2; // 黄 金 分 割 = 1.618 033 98… 
while(cin >> n>> m){ 
inta = min(n, m), b = max(n, m); 
double k = (double)(b - a); 


int test = (int)(k* gold); // 乘 以 黄金 分 割 数 ,然后 取 整 
if(test == a) cout << 0 << endl; // 先 手 败 
else cout << 1 << endl; // 先 手 胜 
} 
return 0; 
} 
8.6 小 结 


数学 题 是 算法 竞赛 中 的 重点 内 容 , 包 含 的 内 容 也 相当 广泛 。 本 章 讲解 了 一 些 竞 赛 中 基 
本 的 和 常用 的 知识 点 ,还 有 很 多 大 类 没有 涉及 ,例如 积分 、 线 性 规划 、 傅 里 叶 变 换 等 。 

有 一 些 比较 基础 的 知识 点 本 章 没有 提 到 ,但 是 需要 读者 掌握 ,例如 高 斯 消 元 、 中 国 剩余 
定理 ,Polya 原理 、 欧 拉 函 数 、 莫 比 乌 斯 卫 数 等 。 

在 一 个 竞赛 队 中 ,所 有 队员 都 需要 掌握 本 章 的 内 容 , 并 且 至 少 应 该 有 一 个 队员 深入 钻研 
数学 类 题目 。 


中 威 佐 夫 游戏 的 奇异 局 势 和 黄金 分 割 数 有 关 ,Fibonacci 数列 也 和 黄金 分 割 数 有 关 , 两 者 在 这 里 发 生 了 联系 。 关 于 
威 佐 夫 游戏 的 奇异 局 势 和 黄金 分 割 数 之 间 关 系 的 证 明 , 请 参考 “http://www. matrix67. com/blog/archives/6784”( 永 久 
网 址 : perma. cc/BCX4-9XXJ) 。 
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所 常用 字符 串 函 数 

如 字符 囊 哈 希 

扣 字 典 树 

2 KMP 

如 AC 自动 机 

要 后 缓 树 和 后 组 数组 

字符 串 处 理 是 竞赛 中 的 常见 题目 ,除了 简单 的 字符 串 查 找 、 替 换 、 匹 配 等 问题 以 外 ,还 有 
比较 复杂 的 字符 串 算法 ,其 中 应 用 广泛 的 有 字符 串 哈 希 .KMP、 字 典 树 (Trie Tree)、AC 自 
动机 和 后 组 数组 等 。 


9.1 字符 串 的 基本 操作 


字符 串 的 基本 操作 有 读 和 查找、 替换 、 截 取 、 数 字 和 字符 串 转换 等 。 下 面 用 一 个 例题 介 
绍 字 符 串 的 读 人 查找 和 替换 操作 。 


poj 3981“ 字 符 串 替换 ” 
读 取 一 个 字符 串 ,把 其 中 所 有 的 "you" 替 换 成 "we"。 


下 面 的 程序 一 次 读 取 一 个 完整 的 字符 串 ,用 gets() 函 数 实现 。 
C 程序 1 


# include < stdio.h> 
char str[1002]; 
int main(){ 
int i; 
while(gets(str) != NULL) { 
for(int i=0; str[i]!= '\0'; i++) 
if(str[i] == 'y'&& str[i+1] == '0'&& str[i+2] == 'u') { 
printf("we"); 
i+=2; 
} 
else 
printf(" %c", str[i]); 
printf("\n"); 
} 


return 0; 


i 


下 面 的 程序 一 次 只 读 一 个 字符 ,用 getchar() 函 数 实现 。 这 个 程序 比 上 一 个 程序 要 好 ， 
因为 它 不 需要 定义 一 个 字符 串 数 组 ,当然 也 不 用 考虑 数组 的 大 小 。 


C 程序 2 


# include < stdio.h> 
int main(void){ 
char chl, ch2, ch3; 
while( (chl = getchar()) != EOF) { 
if(chl == 'y') { 
if((ch2=getchar()) == '0') { 
if((ch3= getchar()) == 'u') 
printf("we"); 
else 
printf("yo% c", ch3); 
} 


else 
printf("y% c", ch2); 
} 
else 
putchar(chl); 
} 
return 0; 


} 


下 面 的 程序 用 到 string 类 .getline() 函 数 。 
C++ 程序 


# include < bits/stdc++.h> 
using namespace std; 
int main(){ 
string str; 
int pos; 
while(getline(cin, str)){ 
while( (pos= str.find("you")) != -1) 
str. replace(pos, 3, "we"); 
cout << str << endl; 
} 


return 0; 


【习题 】 


hdu 1062, 字 符 串 反 转 。 
hdu 6013 ,字符 串 反 转 , 尺 取 法 。 
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hdu 5007, 子 串 查 找 。 

hdu 1238, 求 多 个 字符 串 的 最 大 公共 子 串 ,用 暴力 法 做 。 
hdu 4054, 输 出 字符 的 ASCII 码 。 

hdu 2055 ,字符 串 和 数字 转换 。 

hdu 5938, 字 符 串 和 数字 转换 。 


9.2 字符 串 哈 希 


首先 看 一 个 比较 特殊 的 字符 串 匹 配 问题 : 在 很 多 字符 串 中 尽快 操作 某 个 字符 串 。 如 果 
字符 串 的 规模 很 大 ,访问 速度 很 关键 ,具体 例子 参考 hdu 2648 题 。 在 本 书 第 3 章 的 “3. 1.7 
map” 中 曾 以 hdu 2648 为 例 讲解 了 用 map 容器 匹配 字符 串 的 方法 。 这 里 用 字符 串 哈 希 的 方 

这 个 问题 用 哈 希 (hash) 方 法 解决 是 最 快 的 。 用 喻 希 函 数 对 每 个 子 串 进行 喻 希 , 分 别 映 
射 到 不 同 的 数字 , 即 一 个 整数 哈 希 值 .然后 就 可 以 根据 哈 希 值 找到 子 串 , 接 下 来 配合 使 用 数 
据 结构 或 STL 完成 判 重 、 统 计 、 查 询 等 操作 。 

喻 希 函 数 是 其 中 的 核心 。 理 论 上 ,任意 函数 h(xz) 都 可 以 是 喻 希 函 数 , 不 过 一 个 好 的 哈 
希 函 数 应 该 尽量 避免 冲突 。 这 个 字符 串 喻 希 函 数 最 好 是 完美 喻 希 函 数 。 完 美 喻 希 函 数 是 指 
没有 冲突 的 哈 希 函数 : 把 个子 串 的 key 值 映射 到 m 个 整数 上 ,如 果 对 任意 的 keyl 天 
key2, 都 有 hh(key1) 隆 h(key2) ,这 就 是 完美 哈 希 函数 。 此 时 必然 有 n 三 mm。 更 进一步 ,如 果 
n 三 m, 称 为 最 小 完美 哈 希 函数 。 

那么 如 何 找到 一 个 接近 完美 的 字符 串 哈 希 函 数 ? 有 一 些 经 典 的 字符 串 哈 希 函数 ,例如 
BKDRHash、APHash、DJBHash、JSHash 等 。 一 般 使 用 BKDRHash, 求 得 的 喻 希 值 几 乎 不 
会 冲突 碰撞 。 但 在 实际 应 用 时 由 于 得 到 的 哈 希 值 都 很 大 ,不 能 直接 映射 到 一 个 巨大 的 空间 
上 ,所 以 一 般 需 要 限制 空间 。 方 法 是 取 余 : 把 得 到 的 哈 希 值 对 一 个 设 定 的 空间 大 小 取 余 数 ， 
以 余数 作为 索引 地 址 。 当 然 , 这 样 做 会 产生 冲突 问题 。 

下 面 用 字符 串 哈 希 方法 重新 求解 hdu 2648 。 

在 下 面 的 程序 中 , 哈 希 函数 BKDRHash() 计 算 字 符 串 的 hash 值 ,返回 一 
个 unsigned int 数 。 根 据 上 面 的 讨论 可 知 , 由 于 这 个 数 可 能 很 大 ,不 能 直接 分 
配 空 间 ,程序 用 一 个 较 小 的 N 取 余 ,分 配 到 大 小 为 N 的 空间 。 这 样 做 会 产生 
冲突 ,所 以 程序 的 大 部 分 代码 是 解决 冲突 问题 。 


hdu 2648 的 字符 串 哈 希 程 序 


#include < bits/stdc++.h> 
using namespace std; 
const int N = 10005; 
struct node{ 
char name[35]; 
int price; 
}; 
vector <node> List[N]; // 用 于 解决 冲突 
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unsigned int BKDRHash(char * str) { // 哈 希 函 数 
unsigned int seed = 31,key = 0; 
while( * str) 
key = key* seed+ (* str++); 
return key & Ox7fffffff; 
} 
int main(){ 
int n, m, key, add, memory price, rank, len; 
int p[N]; 
char s[35]; 
node t; 
while(cin>>n){ 
for(int i=0; i<N; i++) 
List[il].clear(); 
for(int i=0;i<n;it+){ 
cin >> t. name; 


key = BKDRHash(t.name) % N; // 计 算 hash 值 ,并 求 余 

List[key]. push_back(t); //hash 值 可 能 冲突 ,把 冲突 的 哈 希 值 都 存 起 来 
} 
cin>>m; 
while(m—— ){ 


rank = len = 0; 
for(int i=0; i<n; i++){ 
cin>>add>>s; 
key = BKDRHash(s) % N; // 计 算 hash 值 
for(int j= 0; j<List[key]. size(); j++) // 处 理 冲突 问题 
if(strcmp(List[key][j].name, s) == 0){ 
List[key][j].price += add; 
if(strcmp(s, "memory") == 0) 
memory_price = List[key][j].price; 
else 
p[len++] = List[key][j].price; 
break; 
} 
} 
for(int i=0; i<len; i++) 
if(memory price < p[i]) 
Iank++ 7 
cout << rank+ 1 << endl; 


return 0; 


【习题 】 


hdu 4821 “String”。 
hdu 4080 “Stammering Aliens”。 
hdu 4622 “Reincarnation”。 


hdu 4622 ,字符 串 哈 希 , 较 难 。 
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9.3 字 典 树 


再 次 回顾 一 个 常见 的 字符 串 匹配 问题 : 在 个 字符 串 中 查找 某 个 字符 串 。 

如 果 用 暴力 的 方法 ,需要 逐个 匹配 每 个 字符 串 ,复杂 度 是 O(nm) , 是 字符 串 的 平均 长 
度 。 这 个 操作 的 效率 十 分 低 。 

那么 有 没有 很 快 的 方法 ? 大 家 都 有 查 英语 字典 的 经 验 , 例 如 查找 单词 “dog”, 先 翻 到 字 
典 的 d 部 分 ,再 翻 到 第 2 个 字母 o、 第 3 个 字母 g, 一 共 找 3 次 即 可 。 查 找 任意 单词 ,查找 次 
数 最 多 只 需要 这 个 单词 的 字母 个 数 。 

字典 树 就 是 模拟 这 个 操作 的 数据 结构 , 它 的 时 间 复 杂 度 和 空间 复杂 度 都 很 好 。 

(1) 时 间 复杂 度 : 插入 和 查找 单词 的 复杂 度 都 是 O(m) ,其 中 m 是 待 插 入 /查询 字符 串 
的 长 度 。 

(2) 空间 复杂 度 : 有 公共 前 缀 的 单词 只 需要 存 一 次 公共 前 级 ,节省 了 空间 。 

图 9. 1 所 示 为 单词 be、bee、may、man、momo.he 的 字典 树 。 

从 图 9.1 可 以 归纳 出 字典 树 的 基本 性 质 : 根 结 点 不 包含 
字符 ,除根 结 点 外 的 每 个 子 结 点 都 包含 一 个 字符 ; 从 根 结 点 
到 某 一 个 结 点 ,路 径 上 经 过 的 字符 连接 起 来 ,为 该 结 点 对 应 
的 字符 串 ; 每 个 结 点 的 所 有 子 结 点 包含 的 字符 互 不 相同 。 

通常 在 实现 的 时 候 会 在 结 点 设置 一 个 标志 ,标记 该 结 点 《9 
是否 为 单词 的 末尾 ,例如 图 中 画 线 的 字符 。 

字典 树 有 以 下 常见 的 应 用 ， 剧 4 学员 

(1) 字符 串 检索 。 检 索 、 查 询 功 能 是 字典 树 的 基本 
功能 。 

(2) 词 频 统 计 。 统 计 一 个 单词 出 现 了 多 少 次 。 

(3) 字符 串 排序 。 在 插入 的 时 候 , 在 树 的 平 级 按 字 母 表 的 顺序 插入 。 字 典 树 建 好 之 后 ， 
用 先 序 遍 历 ,就 得 到 了 字典 树 的 排序 。 

(4) 前 级 匹配 。 字 典 树 是 按 公 共 前 级 来 建树 的 ,很 适合 用 于 搜索 提示 。 例 如 Linux 的 
行 命令 ,输入 一 个 命令 的 前 面 几 个 字母 ,系统 会 自动 补 全 命令 后 面 的 字符 。 

字典 树 在 本 书 “9.5 AC 自动 机 ”中 也 有 应 用 。 

下 面 的 例题 给 出 了 字典 树 的 具体 实现 。 


hdu 1251“ 字 典 树 ” 
很 多 单词 只 由 小 写字 母 组 成 ,不 会 有 重复 的 单词 出 现 , 统 计 出 以 某 个 字符 串 为 前 缓 
的 单词 数量 。 


该 题 有 多 种 方法 。 

1. 用 map 实现 

这 一 题 用 map 来 做 非常 简单 .代码 如 下 : 
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#include <bits/stdc++.h> 
using namespace std; 
int main(){ 

char str[10]; 

map < string, int> m; 


while(gets(str)){ 
int len = strlen(str); 
证 (!len) break; // 输 入 了 一 个 空 行 
for(int i = len; i>0; i--){ 
str[i] = "\0'; // 从 后 往 前 删除 这 个 字符 串 的 字符 ,得 到 前 级 
m[ str]++ 7 // 统 计 前 缀 的 数量 
} 
} 
while(gets(str)) cout <<m[ str] << endl; 
return 0; 
2. 用 字典 树 实现 


首先 用 正规 的 字典 树 实现 ,定义 字典 树 的 数据 结构 ,并 用 指针 指向 下 一 层 子 树 ,代码 很 
清晰 。 不 过 ,由 于 本 题 的 空间 要 求 较 高 ,Insert() 内 用 new Trie 分 配 的 空间 超过 了 题目 的 限 
制 ,代码 会 MLE。 


空间 超额 (MLE) 的 代码 
# include < bits/stdc++.h> 
using namespace std; 
struct Trief // 字 典 树 的 定义 
Trie* next[26]; 
int num; // 以 当前 字符 串 为 前 级 的 单词 的 数量 
Trie() { // 构 造 函 数 
for(int i=0;i<26;i++) next[i] = NULL; 
num= 0; 
} 
}; 
Trie root; 
void Insert(char str[]){ // 将 字符 串 插入 到 字典 树 中 
Trie *p = &root; 
for(int i=0;str[i];it+){ // 遍 历 每 一 个 字符 


if(p—>next[str[i] - 'a'] == NULL) // 如 果 该 字符 没有 对 应 的 结 点 
p->next[str[i]- 'a'] = new Trie; // 创 建 一 个 

p= p->next[str[i]— 'a']; 

p—>numt+; 


下 
int Find(char str[]){ // 返 回 以 字符 串 为 前 缀 的 单词 的 数量 
Trie *p = &root; 
for(int i=0;str[i];it+){ // 在 字典 树 中 找到 该 单词 的 结尾 位 置 
if(p—->next[str[i] -~ 'a'] == NULL) 
return 0; 
p= p->next[str[i]— 'a']; 
} 


* 
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return p 一 > num; 
} 
int main(){ 
char str[11]; 
while(gets(str)){ 
证 (!strlen(str)) break; // 输 入 了 一 个 空 行 
Insert(str); 
} 
while(gets(str)) cout << Find(str) << endl; 
return 0; 


} 


更 好 、 更 紧凑 的 存储 方法 是 用 数组 来 实现 字典 树 的 数据 结构 ,在 竞赛 中 用 这 种 方法 更 加 
保险 。 相 关 代 码 如 下 : 


用 数组 实现 字典 树 
int trie[1000010][26]; // 用 数组 定义 字典 树 , 存储 下 一 个 字符 的 位 置 
int num[1000010] = {0}; // 以 某 一 字符 串 为 前 级 的 单词 的 数量 
int pos = 1; // 当 前 新 分 配 的 存储 位 置 
void Insert(char str[ ]){ // 在 字典 树 中 插入 某 个 单词 


intp = 0; 
for(int i=0;str[i];it+){ 
intn = str[i]- 'a'; 
if(trie[p][n] == 0) // 如 果 对 应 字符 还 没有 值 
trie[p][n] = post+; 
p= trie[p][n]， 
num[ p]++; 
int Find(char str[]){ // 返 回 以 某 个 字符 串 为 前 级 的 单词 的 数量 
intp = 0; 
for(int i=0;str[i];it+){ 
intn = str[i]- 'a'; 
if(trie[p][n] == 0) 
return 0; 
p= trie[p][n]， 
} 


return num[ p]; 


9.4 KMP 


KMP 是 单 模 匹 配 算法 , 即 在 一 个 长 度 为 的 文本 串 中 查找 一 个 长 度 为 m 

的 模式 绅 。 它 的 复杂 度 是 O(m 十 1) ,差不多 是 此 类 算法 能 达到 的 最 优 复 杂 度 。 
1. 朴素 的 模式 匹配 算法 艾 
在 前 面 讲 字符 串 哈 希 时 曾 用 哈 希 解决 了 特定 字符 子 串 的 匹配 问题 ,下 面 视频 讲解 
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讨论 更 一 般 性 的 问题 。 

模式 匹配 (Pattern Matching) : 在 一 篇 长 度 为 n 的 文本 S 中 , 找 某 个 长 度 为 m 的 关键 词 
P。 PP 可 能 多 次 出 现 ,都 需要 找到 。 这 个 一 般 性 问题 用 哈 希 算法 不 合适 ,很 麻烦 。 

最 优 的 模式 匹配 算法 复杂 度 能 达到 多 好 ? 由 于 至 少 需要 检索 文本 S 的 个 字符 和 关 
键 词 P 的 m 个 字符 ,所 以 复杂 度 至 少 是 OC(m 十 n)。 

先 考虑 暴力 方法 ( 即 朴素 的 模式 匹配 算法 ): 在 S 的 所 有 字符 中 逐个 匹配 P 的 每 个 字 
符 。 例 如 ,S 二 "abcxyz123",P 二 "123"。 第 1 次 匹配 ,PL[0j 关 SL0J], 后 面 的 PL1]、PL2] 就 不 
用 比较 了 。 一 共 比 较 6 十 3=9 次 就 好 了 ,其 中 前 6 次 对 比 P 的 第 1 个 字符 ,第 7 次 对 比 P 
的 3 个 字符 ,如 图 9.2 所 示 。 

这 个 例子 比较 特殊 ,P 和 S 的 字符 基本 上 都 不 一 样 。 在 每 次 匹配 时 ,往往 第 1 个 字符 就 
对 不 上 ,用 不 着 继续 匹配 P 后 面 的 字符 。 复 杂 度 差不多 是 O(n 十 m) ,这 已 经 是 字符 串 匹 配 
能 达到 的 最 优 复杂 度 了 。 所 以 ,如 果 字符 串 S、P 符合 这 个 特征 ,用 暴力 法 是 不 错 的 选择 。 

但 是 ,如 果 情 况 比 较 坏 , 例 如 P 的 前 m 一 1 个 都 容易 找到 匹配 ,只 有 最 后 一 个 不 匹配 , 那 
么 复杂 度 就 退化 成 O(nm)。 例 如 S= "aaaaaaaab" ,P=="aab" ,需要 尝试 6X3 十 3 二 21 次 ， 
如 图 9. 3 所 示 , 远 远 超 过 上 面 例子 中 的 9 次。 


a[e[s[xly[z[12T3 3|ajajalalalajalalb| 
Blilzls|l Plalalb 
x 标定 党 
(a) 第 1 轮 匹配 ， 首 字符 就 失 配 (a) 第 1 轮 匹配 ， 需 要 判断 3 次 ， 不 成 功 
Slalbljc|xly|lzl1|2|3 Slalalalalalalalalb 
到 1|2|3 Pr alalb 
x Vx 
(b) 第 2 轮 匹配 ， 首 字符 就 失 配 (b) 第 2 轮 匹配 ， 也 判断 3 次 ， 仍 不 成 功 
s|ajble|xly|z|: 2z|3 Silalalalalalalalalb 
F 1 泥 :|3 Pp alalb 
yy yy 
(©) 第 7 轮 匹配 ， 成 功 (c) 第 7 轮 匹配 ， 成 功 
图 9.2 匹配 示意 图 9.3 情况 比较 坏 时 的 匹配 
2. KMP 算法 


KMP 是 一 种 在 任何 情况 下 都 能 达到 O(n 十 m) 复 杂 度 的 算法 。 它 是 如 何 做 到 的 ? 简单 
地 说 , 它 通过 分 析 P 的 特征 对 P 进行 预 处 理 ,从 而 在 与 S 匹配 的 时 候 能 够 跳 过 一 些 字符 串 ， 
达到 快速 匹配 的 目的 。 

下 面 简单 图 解 KMP 的 操作 过 程 , 如 图 9.4 所 示 。S[ ]=="abcabcabcd" ,PL ]=="abcd"。 
图 中 的 i 指向 S[ 疏 ,j 指向 PLjj].,0<i<n,0<j<m。 

图 9. 4(c) 说 明 ,在 用 KMP 算法 时 ,指向 S 的 i 指针 不 会 回溯 ,而 是 一 直 往 后 走 到 底 。 与 
图 9. 4(b) 的 朴素 方法 相 比 ,大 大 减少 了 匹配 次 数 。 请 读者 自己 分 析 复 杂 度 是 否 为 OG 十 m)。 

那么 KMP 是 如 何 让 i 不 回溯 ,只 回溯 j 的 呢 ? 这 就 是 KMP 的 核心 一 一 Next[ ] 数 组 (也 有 
写成 shift 或 者 fail 的 )。 当 出 现 失 配 后 ,进行 下 一 次 匹配 时 ,用 Next[ 指出 j 回溯 的 位 置 。 
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Io|lo 
一 |e |e 


in| 
,一 x ols | ~ 


~ 
(a) 第 1 轮 匹配 后 ， 在 二 3， 记 3 的 位 置 失 配 


1 
S|a|blc|a clalblelal 
P |alblcla 

和 

到 


(b) 第 2 轮 匹配 ， 如 果 用 朴素 方法 ，i 和 j 回 到 二 1，_ 关 0 的 位 置 重新 开始 


i 
! 
s|alble|alble|alblcla 
a 
1 


j 
(0) 第 2 轮 匹配 ， 采 用 KMP 算 法 ， 二 3 不 变 ，j 回 到 .0 的 位 置 重新 开始 
图 9.4 简单 图 解 KMP 的 操作 过 程 
Next[] 是 通过 对 P 进行 预 处 理 得 到 的 。 在 下 面 hdu 2087 题 的 程序 中 用 getFail() 函 数 


求 Next[ 数组 。 该 程序 虽然 很 短 , 却 复杂 难 解 ,请 读者 自己 阅读 资料 9 。 
有 了 Next[] 数 组 ,就 能 很 容易 地 写 出 KMP 程序 ,代码 见 下 面 的 例子 。 


3. KMP 模板 题 


hdu 2087“ 剪 花 布 条 ” 

一 块 花 布 条 ,上 面 印 有 一 些 图 案 , 另 有 一 块 直接 可 用 的 小 饰 条 ,也 印 有 一 些 图 案 。 
对 于 给 定 的 花 布 条 和 小 饰 条 ,计算 一 下 能 从 花 布 条 中 尽 可 能 剪 出 几 块 小 饰 条 。 

输入 : 每 一 行 是 成 对 出 现 的 花 布 条 和 小 饰 条 。 划 表示 结束 。 

输出 : 输出 能 从 花纹 布 中 剪 出 的 小 饰 条 的 最 多 个 数 。 

输入 样 例 : 

abcde a3 

aaaaaa aa 

井 

输出 样 例 : 

0 

3 


@ “从 头 到 尾 彻 底 理解 KMP”, 网 址 为 “https://blog. csdn. net/v_july_v/article/details/7041827 (永久 网 址 : 
perma. cc/FY2G-6P67)”。 
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本 题 可 以 完全 套用 KMP 的 模板 。KMP 算法 的 模板 有 两 部 分 , 即 getFail() 和 kmp() 。 
getFail() 预 计算 Next[ ] 数 组 ; kmp() 函 数 实 现在 S 中 找 己 ,注意 每 次 匹配 到 的 起 始 位 置 是 
s[i 十 1 一 plen], 末 尾 是 [让 。 

找到 的 匹配 可 能 有 很 多 个 ,而 且 可 能 重合 ,例如 "aaaaaa" 中 包含 了 3 个 "aa"。 但 在 本 题 
中 需要 找到 能 分 开 的 子 串 , 即 剪 出 不 同 的 小 饰 条 。 这 个 问题 容易 解决 ,只 需要 在 程序 中 加 一 
名 if(i 一 last > 一 plen) 进 行 判断 即 可 。 


KMP 程序 


# include < bits/stdc++.h> 
using namespace std; 
const int MAXN = 1000+5; 
char str[MAXN], pattern[ MAXN]; 
int Next[MAXN]; 
int cnt; 
int getFail(char *p, int plen){ 
// 预 计算 Next[ ], 用 于 在 失 配 的 情况 下 得 到 j 回溯 的 位 置 
Next[0] = 0; Next[1] = 0; 
for(int i=1; i< plen; i++){ 
int j = Next[i]; 
while(j gg p[i] (= p[j]) j= Next[j]; 
Next[i+1] = (p[i] ==p[j])?j+1:0; 


} 
} 
int kmp(char *s, char *p) { // 在 S 中 找 P 
int last = -1; 
int slen = strlen(s), plen= strlen(p); 
getFail(p, plen); // 预 计算 Next[ ] 数 组 
int j=0; 
for(int i=0; i<slen; i++) { // 匹 配 S 和 了 的 每 个 字符 
while(j && s[i]!=p[j]) j=Next[j]; // 失 配 了 ,用 Next[] 找 j 的 回溯 位 置 
if(s[i] ==p[j]) j++; // 当 前 位 置 的 字符 匹配 ,继续 
if(j == plen) { // 完 全 匹配 
// 这 个 匹配 ,在 S 中 的 起 点 是 i+ 1- plen, 末 尾 是 i, 如 有 需要 可 以 打印 
//printf("at location = %d, %s\n", i+1- plen,&s[i+1- plen]); 
t=" 下 面 是 与 本 题 相关 的 工作 
if(i— last >=plen) { // 判 断 新 的 匹配 和 上 一 个 匹配 是 否 能 分 开 
cnt++ 
last = i; //last 指向 上 一 次 匹配 的 末尾 位 置 
} 
OO 
} 
} 
和 
int main(){ 
while(~scanf("%s", str)){ // 读 串 
if(str[0] == '#') break; 
scanf("%s", pattern); // 读 模式 串 
cnt = 0; 
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kmp(str, pattern); 
printf(" % d\n", cnt); 
} 


return 0; 


【习题 】 


hdu 1686/1711/2222/2896/3065/3336 。 
hdu 2594"Simpsons” Hidden Talents" ,扩展 KMP 算法 , 求 原 串 S 的 每 一 个 后 级 子 串 与 
模式 串 PP 的 最 长 公共 前 级 。 


9.5 ”AC 自动 机 


AC 自动 机 (Aho-Corasick automaton) 是 KMP 的 升级 版 。KMP 是 单 模 匹配 算法 ,处 
理 在 一 个 文本 串 中 查找 一 个 模式 串 的 问题 ; AC 自动 机 是 多 模 匹配 算法 ,能 在 一 个 文本 串 中 
同时 查找 多 个 不 同 的 模式 串 。 

多 模 匹 配 问题 : 给 定 一 个 长 度 为 n 的 文本 S, 以 及 k 个 平均 长 度 为 m 的 模式 串 Pi ,Ps ,…， 
P ,要 求 搜索 这 些 模 式 串 出 现 的 位 置 。 

其 实用 KMP 也 能 解决 多 模 匹配 问题 ,缺点 是 复杂 度 较 高 ,需要 对 每 个 Pi , P,,…，,P 忆 
分 别 做 一 次 KMP, 总 复杂 度 是 OC((n 十 m)k)。 

AC 自动 机 算法 并 不 需要 对 S 做 多 次 KMP ,而 是 只 搜索 一 遍 S, 在 搜索 时 匹配 所 有 的 
模式 串 。 

如 何 同时 匹配 所 有 的 P? 如 果 读 者 能 结合 前 面 介绍 过 的 字典 树 就 忧 然 大 悟 了 。 

KMP 是 通过 查找 已 对 应 的 Next[] 数 组 实现 快速 匹配 的 。 如 果 把 所 有 的 P 做 成 一 个 
字典 树 ,然后 在 匹配 的 时 候 查 找 这 个 已 对 应 的 Next[] 数 组 ,不 就 实现 了 快速 匹配 的 效果 吗 ? 

复杂 度 分 析 : & 个 模式 串 ,平均 长 度 为 m; 文本 串 长 度 为 n。 建 立 字典 树 OC(km); 建立 
fail 指针 OCkm); 模式 匹配 O(Czzz) , 乘 m 的 原因 是 在 统计 的 时 候 需 要 顺 着 链 回 溯 到 root 结 
点 。 总 时 间 复 杂 度 是 OC(km 十 km 十 nm) 二 OCkm 十 nn) 。 

对 比 简单 使 用 KMP 的 复杂 度 O(n 十 wD)k), 当 mk 时,(k 十 WD)m 安 (nn 十 m)k。AC 自 
动机 优势 非常 大 。 

hdu 2222 题 是 一 道 模板 题 。 


hdu 2222 “Keywords Search” 
有 多 个 关键 词 ,在 一 个 文本 中 找到 它们 。 
输入 : 第 1 行 是 测试 用 例 个 数 。 每 个 用 例 包 括 一 个 整数 N, 表 示 关 键 词 个 数 , 下 面 
有 NN 个 关键 词 ,N 三 10 000。 每 个 关键 词 只 包括 小 写字 母 ,长 度 不 超过 50。 最 后 一 行 是 
文本 ,长 度 不 大 于 1 000 000。 
输出 : 在 输出 文本 中 能 找到 多 少 关 键 词 。 重 复 的 关键 词 只 需要 统计 一 次 。 


= 202“。 


下 面 是 代码 ?。 


# include <bits/stdc++.h> 
using namespace std; 
const int maxn = 1000000 + 100; 
const int SIGMA SIZE = 26; 
const int maxnode = 1000000 + 100; 
int n, ans; 
bool vis[maxn]; 
map< string, int > ms; 
int ch[maxnode][SIGMA SIZE+5]; 
int val[maxnode]; 
int idx(char c) {returnc - 'a';} 
struct Trie { 
int sz; 
Trie() { sz = 1; memset(ch[0], 0, sizeof(ch[0])); memset(vis, 0, sizeof(vis)); } 
void insert(char * s) { 
intu = 0,n = strlen(s); 
for(int i = 0; i<n; i++) { 
intc = idx(s[i]); 
证 (!ch[u][c]) { 
memset(ch[sz]，0，sizeof(ch[ sz])); 
val[sz] = 0; 
ch[u][c] = sz++; 


} 
u = ch[u][c]， 
} 
val[u]++; 
} 
}; 
//aC 自动 机 
int last[maxn], f[maxn]; 
void print(int j) { 
if(j && !vis[j]) { 
ans += val[j]; vis[j] = 1; 
print(last[j]); 
} 
} 
int getFail() { 
queue < int > q; 
f[0] = 0; 
for(int c = 0; c< SIGMA SIZE; c++) { 
intu = ch[0][c]; 
if(u) {f[u] = 0; q.push(u); last[u] = 0;} 
} 
while(!q. empty()) { 
int r = q.front(); q.pop(); 
for(int c = 0; c< SIGMA SIZE; c++) { 
ch[r][c]， 


int u 
if(!u) { 
ch[r][c] = ch[f[r]]j[c]， 


外 其 中 ,getFail() 来 自 (算法 竞赛 入 门 经 典 训练 指南 》, 刘 汝 佳 ,陈锋 ,清华 大 学 出 版 社 ,3. 3. 3 节 ,214 页 。 
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continue; 
} 
-push(u); 
intv = f[r]; 
while(v && !ch[v][c])v = f[v]; 
f[u] = ch[v][c]; 
last[u] = val[f[u]] ? f[u] : last[f[u]]; 


} 
} 
void find T(char * T) { 
int n = strlen(T); 


intj = 0; 
for(int i = 0; i<n; it+) { 
intc = idx(T[i]); 


j = ch[j][c]; 
if(val[j]) print(j); 
else if(last[j]) print(last[j]); 
} 
} 
char tmp[105]; 
char text[1000000 + 1000]; 
int main() { 
int T; cin > T; 
while(T-- ) { 
scanf(" %d", gn); 
Trie trie; 
ans = 0; 
for(int i = 0; i<n; i++) { 
scanf("%s", tmp); 
trie. insert (tmp); 
} 
getFail(); 
scanf("%s", text); 
find_T(text); 
cout << ans << endl; 


return 0; 


【习题 】 


hdu 2243/2825/2296,AC 自动 机 十 DP 状态 压缩 。 


9.6 后 级 树 和 后 缀 数组 


后 级 树 和 后 缀 数组 理解 起 来 比较 难 , 但 是 可 以 解决 大 部 分 字符 串 问 题 ,前 面 提 到 的 字符 
串 匹 配 问题 ,例如 查找 子 串 、 最 长 重复 子 串 、 最 长 公共 子 串 等 ,都 可 以 用 后 绥 数 组 解决 ,这 类 
题目 是 编程 竞赛 的 常见 题 型 。 
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本 节 首 先 讲解 后 绥 树 和 后 绥 数 组 的 概念 ,然后 用 后 绥 数 组 解决 一 些 经 典 字符 串 问 题 。 


9.6.1 概念 


后 级 (suffix) : 一 个 字符 串 , 它 的 一 个 后 组 是 指 从 某 个 位 置 开 始 到 末尾 的 一 个 子 串 。 例 
如 字符 串 string s 二 "vamamadn", 它 的 后 级 有 8 个 , 即 s[0]=="vamamadn"、s[1]= 
"amamadn" 、s[2] 二 "mamadn" 等 。 具 体 见 表 9. 1 的 左 半 部 分 。 


表 9.1 后 缀 

后 缀 [站 下 标定 字典 序 后 组 数组 sa[j] 下 标 j 
vamamadn 0 adn 5 0 
amamadn 由 amadn 3 1 
mamadn 2 amamadn 1 2 
amadn 3 dn 6 3 
madn 4 madn 4 4 
adn 5 mamadn 2 5 
dn 6 n 7 6 
n 过 vamamadn 0 7 


后 级 树 (suffix tree) : 就 是 把 所 有 的 后 级 子 串 用 字典 树 的 方法 建立 的 一 棵 树 , 如 图 9. 5 
所 示 。 


图 9.5 后 缀 树 


其 中 , 根 结 点 为 空 ,符号 $ 表示 一 个 后 级 子 串 的 末尾 。 用 $ 的 原因 是 它 比较 特殊 ,不 会 
在 字符 串 中 出 现 , 适 合用 来 做 标识 。 如 果 要 利用 后 级 树 查 找 某 个 子 串 ,例如 "mam" ,只 需要 
从 根 结 点 出 发 查 3 次 即 可 ,这 就 是 后 级 树 的 优势 。 

由 于 直接 对 后 级 树 进行 构造 和 编程 不 太 方 便 , 所 以 用 后 级 数组 (suffix array) 这 种 简单 
的 方法 来 替代 。 在 表 9. 1 中 ,后 级 数组 就 是 按 字典 序 对 应 的 后 级 下 标 : int sa[ ] 二 {5,3,1， 
6,4,2,7,0)}。 很 明显 ,后 级 数组 的 数字 顺序 就 是 后 级 子 串 的 字典 顺序 ,记录 了 子 串 的 有 序 排 
列 。 例 如 saL0]=5, 意 思 是 : 排名 0( 即 字典 序 最 小 ?的 子 串 ,是 原 字 符 串 中 从 第 5 个 位 置 开 
始 的 后 级 子 串 , 即 "adn"。 
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如 果 得 到 了 后 缀 数组 ,可 以 很 方便 地 解决 一 些 字符 串 问 题 。 下 面 介绍 查找 子 串 ( 单 模 匹 
配 )? 问 题 , 即 在 母 串 * 中 查找 子 串 1:。 只 需要 在 后 级 数组 sa[ ] 上 做 二 分 搜索 ,就 能 很 快 地 找到 
子 串 。 比 如 查找 子 串 :一 "ad" ,程序 如 下 : 


# include <bits/stdc++.h> 

using namespace std; 

int find(string s, string t, int * sa){ // 在 s 中 查找 子 串 t; sa 是 s 的 后 级 数组 
int i=0, j=s.length(); 
while(j-i>1){ 


intk = (i+j)/2; // 二 分 法 ,操作 0(logn) 次 

if(s.compare(sa[k],，t. length()，t)<0) /匹配 一 次 ,复杂 度 是 0(m) 
i=k; 

elsej = k; 


} 

if(s.compare(sa[j], t.length(), t) == 0)  // 找 到 了 ,返回 + 在 s 中 的 位 置 
return sa[j]; 

if(s.compare(sa[i], t.1length(), t) == 0) 
return sa[i]; 


return —1; // 没 找到 
} 
int main(){ 
string s = "vamamadn", t= "ad"; // 母 串 和 子 串 
于 全 10 //sa[] 是 s 的 后 缀 数组 ,假设 已 经 得 到 了 


int location = find(s, t, sa); 
cout << location <<":"<< &s[1location]<< endl << endl; // 打 印 上 在 s 中 的 位 置 
} 


每 次 查找 ,复杂 度 都 是 O(mlogsn) ,m 是 子 串 长 度 , 是 母 串 长 度 。 

在 上 面 的 程序 里 事先 已 经 算 好 了 后 级 数组 sa[ ] ,所 以 最 关键 的 问题 是 如 何 高 效 地 求 后 
缀 数组 ” 即 如 何 对 后 级 子 串 进 行 排序 ? 

常用 的 一 种 排序 方法 为 倍增 法 , 它 的 复杂 度 是 O(nlogsn), 下 一 节 将 详细 介绍 这 个 
方法 。 

后 级 数组 是 很 高 效 的 方法 。 例 如 在 上 面 的 查找 子 串 问 题 中 先 求 后 缀 数组 , 青 找 子 串 ,总 
复杂 度 是 O(nlogzn 十 mlogzn)。 对 比 经 典 的 字符 串 匹 配 KMP 算法 ,复杂 度 是 Ot 十 m) ,前 
级 数组 已 经 很 接近 了 。 如 果 直 接 用 后 缀 树 ,速度 更 快 : 建树 的 复杂 度 是 O(mn) ,在 树 上 查找 
一 个 子 串 只 需要 比较 m 次 ,复杂 度 是 O(m)。 

对 比 后 级 数组 和 后 级 树 ,根据 前 面 的 讲解 可 以 知道 ,后 级 树 用 空间 换 时 间 ,复杂 度 很 好 ; 
后 缀 数组 虽然 复杂 度 稍微 差 一 点 ,但 是 使 用 的 空间 小 ,编码 简单 ,所 以 在 竞赛 中 一 般 使 用 后 
组 数组 。 


9.6.2 用 倍增 法 求 后 缀 数组 


在 讲解 倍增 法 之 前 先 考 虑 常见 的 排序 方法 ,例如 快速 排序 。 快 速 排序 ,所 有 元 素 的 比较 
次 数 是 O(nlogzn) ,在 应 用 到 字符 串 排序 时 ,每 两 个 字符 串 还 有 O(n) 的 比较 ,所 以 总 复杂 度 
是 O(logzn) ,显然 不 够 好 。 
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用 倍增 法 对 后 组 排序 的 原理 比较 复杂 ,初学 者 很 难 理解 ,不 过 如 果 读 者 按 以 下 步骤 学 习 
就 会 觉得 很 清晰 。 

例 : 求 字 符 串 "vamamadn" 的 后 级 数组 。 

第 1 步 : 用 数字 代表 字母 ,例如 a 最 小 , 记 为 0; v 最 大 , 记 为 4。 这 个 转换 对 后 级 子 串 
的 排序 没有 影响 (这 一 步 操 作 实 际 上 是 对 所 有 的 后 级 子 串 的 最 高 位 进行 大 小 判定 ,不 过 因为 
很 多 子 串 的 最 高 位 相同 ,对 应 的 数字 也 相同 ,所 以 还 不 能 比较 大 小 )。 

第 2 步 : 连续 两 个 数字 的 组 合 ,相当 于 连续 两 个 字符 。 例 如 40 代表 "va" 、02 代表 "am" 
等 。 最 后 一 个 3 没有 后 续 , 在 尾部 加 上 0, 组 成 30。 这 并 不 影响 字符 的 比较 ,因为 字符 是 从 
头 到 尾 比较 大 小 的 (这 一 步 操 作 是 取 后 级 子 串 的 最 高 两 位 ,数字 的 大 小 代表 子 串 的 最 高 两 位 
的 大 小 )。 

第 3 步 : 连续 4 个 数字 的 组 合 ,相当 于 连续 4 个 字符 。 例 如 4020 代表 "vama" 、0202 代 
表 "amam" 等 。 最 后 的 30 没有 后 续 , 加 上 00, 组 成 3000( 这 一 步 操 作 是 用 数字 代表 后 级 子 串 
的 高 4 位 )。 

特别 需要 注意 的 是 ,并 没有 进行 连续 3 个 数字 的 组 合 。 原 因 有 两 个 ,一 是 不 方便 操作 ， 
二 是 并 不 影响 后 级 子 串 的 大 小 比较 。 

在 第 3 步 操作 后 产生 的 8 个 数字 已 经 全 部 不 一 样 ,能 区 分 大 小 了 。 结 束 ,并 进行 排序 ， 
得 到 rk[]={7,2,5,1,4,0,3,6}。rk 是 rank 的 缩写 ,表示 “名 次 数组 ”"。rk[] 是 字符 串 
"vamamadn" 的 8 个 后 级 子 串 的 排序 。 在 得 到 rk[ 后 ,可 以 求 得 后 缀 数组 sa[ ] 二 {5,3,1,6， 
4,2,7,0} ,如 图 9.6 所 示 。 


第 1 步 4 0 2 0 2 0 1 3 


第 2 步 40 02 20 02 20 01 13 30 


第 3 步 4020 | 0202 2020 | 0201 2013 | 0130 | 1300 | 3000 


排序 rk[] | 7 2 2 1 4 0 3 6 


sali] sa[7] | sa[2] | sa[5] | sa[1] | sa[4] | sa[0] | sa[3] | sa[6] 
i 0 1 2 3 4 5 6 7 


图 9.6 名 次 数组 和 后 组 数组 


上 述 操作 ,因为 每 一 步 都 递增 两 倍 , 所 以 总 步骤 一 共有 log(n) 步 ,非常 少 。 

虽然 上 述 过 程 看 起 来 很 不 错 , 但 是 却 并 不 实用 。 因 为 字符 串 可 能 很 长 ,例如 包含 1 万 个 
字符 ,那么 在 最 后 一 步 产 生 的 每 个 数字 都 有 10 000 位 ,是 个 天 文 数字 ,根本 无 法 存储 和 
排序 。 

那么 能 不 能 在 每 一 步 中 缩小 产生 的 组 合 数字 的 大 小 ,而 且 还 能 保持 顺序 呢 ? 答案 是 能 。 
方法 是 在 每 一 步 操作 后 就 对 组 合 数字 进行 排序 ,用 序号 产生 一 个 新 数字 , 然后 用 新 数字 进 


=“ 207“。 


算法 竞赛 入 门 到 进 阶 


行 下 一 步 操作 ,过 程 如 图 9.7 所 示 。 


V a m a m a d n | 

第 1 步 4 0 2 0 辽 0 1 3 | 
[一 

第 2 步 40 02 20 02 20 01 13 30 | 
zx [s T1131T:i3T° 2:14] 
第 3 步 53 11 33 10 32 04 20 40 | 
排序 rkE| vl silslelslwel| 
sa[i] sa[7] | sa[2] | sa[5] | sa[1] | sa[4] | sa[0] | sa[3] | sa[6] | 


i 0 信和 二 六 -和 六 
图 9.7 改进 后 的 名 次 数组 和 后 组 数组 


可 以 发 现 ,每 一 步 排 序 后 产生 的 新 数字 实际 上 仍然 是 对 后 级 子 串 的 高 位 的 排序 。 所 以 ， 
最 后 的 结果 和 图 9.6 是 一 样 的 。 

产生 的 新 数字 有 多 大 ?假设 字符 串 长 度 n==1 万 , 即 每 一 步 处 理 1 万 个 数 ,那么 产生 的 
新 数字 是 对 这 1 万 个 数 的 排序 结果 ,最 大 就 是 10 000。 所 以 ,每 一 步 的 排序 只 是 对 1 万 个 大 
小 在 1 一 10 000 的 数字 进行 排序 ,这 是 很 容易 做 到 的 。 

在 这 个 过 程 中 ,核心 是 处 理 rk[] 和 sa[ ]。 

1. sa[] rk[] 数 组 

在 后 级 数组 的 相关 程序 中 ,有 3 个 关键 的 数组 : sa[]、rk[] 和 height[]。 下 面 给 出 sa[]、 
rk[] 的 概念 和 相互 关系 ,请 对 照 图 9. 7 进行 理解 。 

sa[ ]: 后 级 数组 suffix array。 保 存 0 一 "一 1 的 全 排列 ,含义 是 ,把 所 有 后 级 按 字典 序 排 
序 后 ,后 级 在 原 串 中 的 位 置 。 性 质 ， suffix(Csa[i)< suffix(sa[i 十 1])。sa[ 记录 “位 置 ”: 
“ 排 第 i 的 是 谁 ?” 一 一 “ 排 第 i 的 后 级 子 串 在 原 串 的 sa[ 门 这 个 位 置 。” 

rk[]: 名 次 数组 rank array。 最 后 得 到 的 rk[ 也 是 0~n 一 1 的 全 排列 ,保存 suffix( 让 在 
所 有 后 级 中 按 字典 序 排序 的 “名 次 ”。rk[] 记 录 “ 排 名 ”: 第 i 个 后 级 子 串 排 第 几 ?” 一 一 “ 原 
串 从 头 数 第 ;个 后 绥 子 串 ,排名 是 rk[i。” 

rkL] 和 sa[] 是 一 一 对 应 关系 , 互 为 道 运算 ,可 以 互相 推导 : 

(1) 用 rk[ 推导 sa[]: 


for(int i=0; i<n; i++) sa[rk[i]] = i; 
(2) 用 sa[] 推 导 rk[]: 


for(int i=0; i<n; i++) rk[sa[i]] = i; 


* 208 。 


2. 用 sort() 函 数 求 后 缀 数组 sal ] 

下 面 用 STL 的 sort() 函数 对 rk[] 排 序 , 并 求 得 后 级 数组 。 程 序 的 核心 就 是 上 面 两 个 推 
导 , 读 者 需要 透彻 理解 才能 看 懂 下 面 的 代码 。 

比较 函数 comp_sa() 判 断 每 一 步 中 得 到 的 组 合 数 的 大 小 。 在 图 9.7 所 示 的 原理 图 中 
例如 从 第 1 步 到 第 2 步 ,把 4.0 组 合成 40, 把 0.2 组 合成 02, 等 等 ,然后 再 用 于 比较 。comp_ 
sa() 省 去 了 组 合 过 程 ,直接 进行 比较 : 首先 比较 40 和 02 的 高 位 ,再 比较 低位 。 

程序 的 逻辑 如 下 : 

(1) 用 sort() 在 每 一 步 根 据 当前 的 rzk 口 计算 出 当前 的 sa[] ,请 读者 认真 体会 细节 。 

(2) 用 sa[] 更 新 下 一 步 用 到 的 rk[]。 注 意 每 一 步 的 sa[], 其 中 任意 两 个 sa[ 让 和 sa[j] 
都 不 同 , 但 是 下 一 步 的 rk[] 中 有 一 些 是 相同 的 ,所 以 sa[] 和 rk[] 还 不 是 一 一 对 应 的 。 此 时 
需要 先 用 sa[] 根 据 原来 的 rk[] 中 的 记录 推导 新 的 rk[], 这 需要 用 一 个 临时 tmp[] 存 放 新 
值 ,然后 再 赋值 给 rk[]。 只 有 到 了 最 后 ,sa[] 和 rk[] 才 是 一 一 对 应 的 。 


计算 后 缀 数组 sa[ ] 的 模板 了 
#include < bits/stdc++.h> 
using namespace std; 
const int MAXN = 200005; // 字 符 串 的 长 度 
char s[MAXN]; // 输 入 字符 串 
int sa[ MAXN], rk[MAXN], tmp[ MAXN + 1]; 
int n, k; 
bool comp_sa(int i, int j){ // 组 合 数 有 两 个 部 分 ,高 位 是 k[i], 低 位 是 rk[i+k] 
if(rk[i] {= rk[j]) // 先 比较 高 位 : rk[i] 和 rk[j] 
return rk[i] < rk[j]; 
else{ // 高 位 相等 ,再 比较 低位 的 rk[i+k] 和 rk[j+k] 
int ri = i+k<=n? rk[i+k] : -1; 
int rj = j+k<=n? rk[j+k] : -1; 


return ri < rj; 
} 
} 


void calc sa() { // 计 算 字符 串 s 的 后 组 数组 
Forlint 4 = O07 Lemny tr) { 
rk[i] = s[i]; // 字 符 串 的 原始 数值 
mldl -= 1 // 后 缀 数组 ,在 每 一 步 记 录 当 前 排序 后 的 结果 
} 
for(k=1;k<=n;k = kx2){ // 开 始 一 步 步 操作 ,每 一 步 递 增 两 倍 进行 组 合 
sort(sa, sa+n, comp_sa); // 排 序 , 结 果 记 录 在 sa[ ] 中 
tmp[sa[0]] = 0; 
for(int = 0; i<n; it+) // 用 sa[] 倒 推 组 合 数 ,并 记录 在 tmp[] 中 
tmp[sa[i+1]] = tmp[sa[i]] + (comp_sa(sa[i],sa[i+1])?1: 0); 
for(int i = 0; i<n; i++) // 把 tmp[ ] 复 制 给 rk[ ], 用 于 下 一 步 操作 


rk[i] = tmp[i]; 


@ 参考 (挑战 程序 设计 竞赛 ), 秋 叶 拓 哉 ,379 页 ,“4.7. 3 后 组 数组 ”。 
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} 


int main(){ 


while(scanf("%s",s)!= EOF){ // 读 字符 串 
n= strlen(s); 
calc_sa(); // 求 后 缀 数组 sa[ ] 
for(int i=0;i<n;it+) // 打 印 后 缀 数组 


cout << sa[ i]<< 


} 


return 0; 


|. 


上 面 的 程序 用 到 的 sort 〇 实际 是 快速 排序 ,每 一 步 排序 的 复杂 度 是 O(nlogsn) ,一 共有 
logzn 个 步骤 ,总 复杂 度 是 O(nlogsn)。 虽 然 已 经 很 好 了 ,不 过 还 有 一 种 更 快 的 排序 方 
法 一 一 基数 排序 ,总 复杂 度 只 有 Olnlogzn)。 在 下 一 节 的 问题 hdu 1403 中 分 别提 交 用 sort() 
和 基数 排序 两 种 方案 的 倍增 法 程序 ,执行 时 间 分 别 是 1000ms 和 80ms。 

3. 基数 排序 

基数 排序 是 一 种 不 太 符合 常识 的 排序 方法 , 它 不 是 先 比较 高 位 再 比较 低位 ,而 是 反 过 
来 , 先 比 较 低位 再 比较 高 位 。 

例如 排序 {47,23,19,17,31}): 

第 1 步 : 先 按 个 位 大 小 排序 ,得 到 {31,23,47,17,19); 

第 2 步 : 再 按 十 位 大 小 排序 ,得 到 {17,19,23,31,47} ,结束 ,得 到 有 序 排列 。 

更 特别 的 是 ,上 述 操作 并 不 是 用 比较 的 方法 得 到 的 ,而 是 用 * 哈 希 ” 的 思路 : 直接 把 数字 
放 到 对 应 的 “格子 ?里 ,第 1 步 按 个 位 放 ,第 2 步 按 十 位 放 。 表 9. 2 中 第 2 步 得 到 的 序列 就 是 
结果 。 


表 9.2 把 数字 放 到 对 应 的 “格子 "里 
格 对 0 1 2 4 5 6 7 8 9 


第 1 步 31 23 47 19 


第 2 步 17.19 23 31 47 


基数 排序 的 复杂 度 : n 个 数 , 每 个 数 有 d 位 (例如 上 面 例 子 中 的 17 一 47 都 是 两 位 数 ) ， 
每 一 位 有 & 种 可 能 (十 进 制 ,0 一 9 共 10 种 情况 ) ,复杂 度 是 O(dCz 十 &)) ,存储 空间 是 O(n 十 
&) 。 对 长 度 10 000 的 字符 串 进 行 一 次 排序 ,z=10 000,d 三 5,k 二 10, 复 杂 度 d(n 十 k) 三 
10 000X5 ,而 一 次 快 排 的 复杂 度 nlogsn 守 10 000X13。 

对 比 快速 排序 等 排序 方法 ,基数 排序 在 d 比较 小 的 情况 下 ( 即 所 有 的 数字 差不多 大 时 ) 
是 更 好 的 方法 。 如 果 d 比较 大 ,基数 排序 并 不 比 快 速 排 序 更 好 。 

下 面 的 程序 用 基数 排序 求 后 缀 数组 ?。 


// 程 序 的 main() 部 分 和 上 面 用 sort() 时 的 一 样 
char s[MRXN] 
int sa[ MAXN], cnt[MAXN], t1[ MAXN], t2[MAXN], rk[ MAXN], height[ MAXN]; 


Q@ 代码 改编 自 《 算 法 竞赛 人 门 经 典 训练 指南 ), 刘 汝 佳 ,陈锋 ,清华 大 学 出 版 社 ,3.4.1 节 。 
I 


int n; 


void calc_sa() { //void build sa(int n, int m) //n 是 字符 串 长 度 
int m= 127; //m 是 小 写字 母 的 ASCII 码 值 范围 .构造 字符 串 s 的 后 


// 缀 数组 ,每 个 字符 的 值 必须 为 0~m 一 1 


int i, *x= tl, *y=t2; 

for(i=0;i<m;it++) cnt[i]=0; 

for(i=0;i<nii++) cnt[x[i] = s[i]]++; 

for(i=1;i<m;i++) cnt[i] +=cnt[i-—1]; 

for(i=n-1;i>=0;i--) sal--cnt[x[i]]]=i; 

//sa[]: 从 0 到 n=-1 

for(int k=1;k<=n;k=k*2){ // 利 用 对 长 度 为 k 的 排序 的 结果 对 长 度 为 2k 的 排序 


int p=0; 
//2nd 
for(i=n-k;i<n;it+) ylp++]=i; 
for(i=0;i<n;it+) if(sa[i]>=k) y[p++] = sa[i]—k; 
//1st 
for(i=0;i<m;it+) cnt[i]=0; 
for(i=0;i<n;it+) cnt[x[y[i]]]++; 
for(i=1;i<m;it+) cnt[i] +=cnt[i—1]; 
for(i=n-1;i>=0;i--) sa[l--cnt[x[y[i]]]]=y[i]; 
Swap(x, y); 
p=1; x[sa[0]]=0; 
for(i=1;i<n;it+) 

x[sa[i]] = 

ylsali-1]]==y[sa[li]]&&y[sali—1] +k]==y[sa[li] +k]?p— 1:p++; 

if(p>=n) break; 


m=p; 


4. 高 度数 组 height[ ] 
height[] 是 一 个 辅助 数组 , 和 最 长 公共 前 级 (Longest Common Prefix, LCP) 相关 。 


height[] 数 组 非常 重要 ,很 多 使 用 后 绥 数 组 解决 的 题目 都 依赖 height[ ] 数 组 完成 。 


LCP(i,j) : suffix(sa[ 让 ) 与 suffixLsa[j]] 的 最 长 公共 前 缀 长 度 , 即 排序 后 第 i 个 后 级 和 


第 j 个 后 级 的 最 长 公共 前 级 长 度 。 


LCP(i,j))=min{LCP(k—1,k)} ,i<kSj 
定义 height[ 门 为 sa[i 一 1] 和 sa[ 训 ,也 就 是 排名 相 邻 的 两 个 后 组 的 最 长 公共 前 组 长 度 。 


例如 前 面 的 "vamamadn" 中 ,sa[1] 表 示 "amadn" ,sa[2] 表 示 "amamadn" ,那么 height[2] 一 3， 
表示 saL1] 和 saL2] 这 两 个 后 级 的 前 3 个 字符 相同 。 


用 暴力 的 方法 可 以 推导 height[] 数 组 , 即 比较 所 有 相 邻 的 sa[ ] ,然而 复杂 度 是 O(n?)。 


下 面 给 出 复杂 度 为 0(7) 的 代码 : 


void getheight (int n){ //n 是 字符 串 长 度 
int 1 k=0; 
for(i=0 ;i<n; it+) rk[sa[i]]=i; // 用 sa[] 推 导 rk[] 
for(i=0; i<n; it) { 


if(k) k==3 


让 
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intj = sa[lrk[i]—1]; 
while(s[i+k]== s[j+k]) k++; 
height[rk[i]] = k; 
下 
} 


height[ ] 数 组 的 应 用 非常 广泛 ,其 中 最 直接 的 应 用 是 求 最 长 重复 子 串 问题 求 最 长 公共 
子 串 问 题 , 见 下 一 节 的 讨论 。 


9.6.3 用 后 缀 数组 解决 经 典 问 题 


在 字符 串 问题 中 有 这 样 一 些 经 典 问 题 , 可 以 用 后 缀 数组 解决 : 

(1) 在 字符 串 s 中 查找 子 串 上 ,具体 操作 见 9. 6.1 节 。 

(2) 在 字符 串 ; 中 找 最 长 重复 子 串 。 先 求 height[ ] 数 组 ,其 中 的 最 大 值 height[ 门 就 是 
最 长 重复 子 串 的 长 度 。 如 果 需 要 打印 最 长 重复 子 串 , 它 就 是 后 级 子 串 sa[i 一 1] 和 sa[ 引 的 最 
长 公共 前 级 。 

(3) 找 字符 串 s 和 ss 的 最 长 公共 子 串 ,以 及 扩展 到 求 多 个 字符 串 的 最 长 公共 子 串 。 最 
长 公共 子 串 (Longest Common Substring) 和 最 长 公共 子 序列 (Longest Common 
Subsequence) 不 同 。 子 串 是 串 的 一 个 连续 的 部 分 , 子 序列 则 不 必 连 续 。 比 如 字符 串 "abcf" 
和 "bcef" 的 最 长 公共 子 串 为 "bc" ,而 最 长 公共 子 序列 是 "bcf"。 这 两 个 问题 ,在 数据 规模 小 
的 情况 下 都 可 以 用 动态 规划 求解 , 设 5 、ss 的 长 度 分 别 是 mn, 则 复杂 度 是 OC(mn)。 然 而 动 
态 规划 并 不 够 好 ,如 果 关 ," 二 10 000, 动 态 规 划 就 不 能 用 了 ,需要 用 后 级 数组 。 

这 个 问题 实际 上 和 上 一 个 问题 “最 长 重复 子 串 "类似 : 合并 s, 和 ,得 到 一 个 大 字符 串 
s, 就 变 成 了 上 一 个 问题 。 技 巧 是 在 合并 的 时 候 需 要 在 s, 和 之 间 插 入 一 个 未 出 现 过 的 特 
殊 字 符 ,例如 '$', 进 行 分 隔 , 人 避免 合并 产生 更 长 的 子 串 。 

具体 操作 : 首先 计算 height[ ] 数 组 ,然后 查找 最 大 的 height[i] ,而 且 它 对 应 的 sa[i 一 1] 
和 sa[ 门 分 别 属于 被 '$ ' 分 隔 的 前 后 两 个 字符 串 时 ,就 是 解 。 

hdu 1403 题 是 最 长 公共 子 串 问题 。 


hdu 1403“ 最 长 公共 子 串 ” 

求 两 个 字符 串 的 最 长 公共 子囊 。 

输入 : 每 个 测试 用 例 包 含 两 个 字符 囊 ,每 个 字符 串 最 多 有 100 000 个 字符 。 所 有 的 
字符 都 是 小 写 的 。 

输出 : 输出 最 长 公共 子 串 的 长 度 。 

输入 样 例 : 

banana 

cianaic 

输出 样 例 : 

3 


在 样 例 中 ,最 长 公共 子 串 是 "ana" ,长 度 是 3。 由 于 字符 串 长 度 是 100 000 ,程序 的 复杂 
:212 ， 


度 不 能 大 于 O(nlogzn) 。 

下 面 给 出 用 后 绥 数 组 实现 的 程序 。 其 中 用 到 的 calc_sa() .getheight() 函数 已 经 在 前 文 
给 出 。 读 者 可 以 分 别 用 sort() 和 基数 排序 实现 的 calc_sa() 提 交 , 经 验证 ,sort() 版 程序 的 执 
行 时 间 是 1000ms ,基数 排序 版 的 是 80ms。 


最 长 公共 子 串 程序 


// 省 略 了 calc_sa() .getheight() 函数, 已 在 上 一 节 给 出 
int main(){ 
int lenl, ans; 
while(scanf("%s", s)!= EOF) { // 读 第 1 个 字符 串 


n= strlen(s); 


lenl = n; 

s[n] = '$°'; // 用 '$ ' 分 隔 两 个 字符 串 
scanf("%s", stn+1); // 读 第 2 个 字符 串 , 与 第 1 个 合 
n= strlen(s); 

calc_sa(); // 求 后 缀 数组 sa[ ] 
getheight(n) ; // 求 height[ ] 数 组 

ans = 0; 


for(int i = 1; i<n; i++) 
// 找 最 大 的 height[i], 并 且 它 对 应 的 sa[i- 1] 和 sa[i] 分 别 属于 前 后 两 个 字符 串 
if(height[i]> ans && 
((sa[i- 1]< lenl &&sa[i]>= lenl) || (sa[i-1]>=1lenl&&gsa[i]< lenl))) 
ans = height[i]; 
printf(" % d\n",ans); 
} 


return 0; 


(4) 找 字 符 串 s 的 最 长 回 文子 串 。 例 如 "helpsoshelp" 的 最 长 回 文 子 串 是 "sos"。 回 文 串 
一 般 用 Manacher 算法 。 


【习题 】 


hdu 5769, 后 级 数组 。 

hdu 3948, 回 文 串 。 

hdu 4691, 最 长 公共 前 级 。 
hdu 5008, 第 小 子 串 。 
hdu 4416 ,后缀 自动 机 。 


9.7 小 结 


DP 等 其 他 算法 。 字 符 串 算法 也 是 算法 竞赛 中 的 难点 。 


图 的 概念 和 存储 

吕 图 的 遍历 和 连通 性 

扣 拓 扑 排 序 

如 欧 拉 路 

后 无 向 图 和 有 向 图 的 连通 性 

如 2-SAT 问题 

局 最 短路 径 

本 最 小 生成 树 

如 最 大 流 : 残留 网 络 、 增 广 路 

名 最 小 制 

如 最 小 费用 最 大 流 

后 二 分 图 匹配 

图 是 一 种 很 常见 的 模型 ,能 描述 事物 或 状态 的 关系 ,很 多 问题 可 以 抽象 为 图 论 问题 。 图 
论 的 算法 十 分 丰富 ,常见 的 问题 或 算法 有 60 多 个 。 在 算法 竞赛 中 ,图 论 属 于 比较 难 的 内 容 。 

本 章 讲解 图 论 的 基本 概念 .图 论 常用 的 数据 结构 、 常 见 的 图 论 \、 网 络 流 算法 ,并 通过 经 典 
题目 分 析 建 模 过 程 ,给 出 标准 程序 。 


10.1 图 的 基本 概念 


图 是 常见 的 抽象 模型 ,由 点 (node, 或 者 vertex) 和 连接 点 的 边 (edge) 组 成 。 图 是 点 和 边 
构成 的 网 。 图 描述 了 事物 之 间 的 连接 。 图 最 典型 的 应 用 场景 是 地 图 ,地 图 由 地 点 和 道路 组 
成 , 它 的 特征 如 下 。 

(1) 地 点 : 可 能 是 十 字 路 口 ,也 可 能 是 三 岔路 口 ,或 者 仅仅 是 一 个 连接 点 。 在 图 论 中 ， 
把 地 点 抽象 为 点 。 

(2) 道路 : 可 能 是 单行 道 或 双 行道 。 抽 象 成 有 向 边 或 无 向 边 。 

(3) 道路 有 过 路 费 : 抽象 成 边 的 权 值 。 

(4) 求 两 点 间 的 最 短 道路 , 即 图 论 里 的 最 短路 径 算法 。 

(5) 在 城市 群 之 间 如 何 修 最 短 的 连通 道路 , 即 图 论 中 的 最 小 生成 树 问 题 。 

地 图 的 这 些 问 题 都 是 图 论 研究 的 对 象 。 

计算 机 网 络 也 是 典型 的 图 问题 ,和 地 图 非常 相似 。 

人 际 关 系 也 可 以 抽象 成 图 , 即 社交 网 络 。 例 如 著名 的 “六 度 空间 理论 ”, 世 界 上 任意 两 个 
人 ,最 多 通过 5 个 中 间 人 就 能 联系 到 。 把 人 看 成 点 ,把 人 和 人 之 间 的 关系 看 成 边 ,这 就 是 一 


个 图 的 连通 性 问题 。 

树 , 即 连通 无 环 图 , 它 是 一 种 特殊 的 图 。 树 的 结 点 从 根 开始 , 层 层 扩展 子 树 ,是 一 种 层次 
关系 ,这 种 层次 关系 保证 了 树 上 的 结 点 不 会 出 现 环 路 。 在 图 的 算法 中 ,经 常 需要 在 图 上 生成 
一 棵 树 ,再 进行 操作 。 

根据 边 有 无 方向 有 无 权 值 有 无 环 路 ,可 以 把 图 分 成 很 多 种 ,例如 : 

(1) 无 向 无 权 图 , 边 没有 权 值 .没有 方向 ; 

(2) 有 向 无 权 图 , 边 有 方向 、 无 权 值 ; 

(3) 加 权 无 向 图 , 边 有 权 值 .但 没有 方向 ; 

(4) 加 权 有 向 图 ; 

(5) 有 向 无 环 图 (Directed Acyclic Graph,DAG) 。 

图 算法 的 复杂 度 显 然 和 边 的 数量 已 \ 点 的 数量 V 相关 。 如 果 一 个 算法 的 复杂 度 是 线性 
时 间 O(V 十 E), 这 几乎 是 图 问题 中 能 达到 的 最 好 程度 了 。 如 果 能 达到 O (VlogsE)、 
O(CElog:V) 或 类 似 的 复杂 度 , 则 是 很 好 的 算法 。 如 果 是 OC(V?*)、O(E? ) 或 更 高 ,在 图 问题 中 
不 算是 好 的 算法 。 


10.2 图 的 存储 


对 图 的 任何 操作 都 需要 基于 一 个 存储 好 的 图 。 图 的 存储 结构 必须 是 一 种 有 序 的 存储 ， 
能 让 程序 很 快 定 位 结 点 xx 和 w 的 边 (u,v), 最 好 能 在 O(1) 的 时 间 内 只 用 一 次 或 几 次 就 定 
位 到 。 

一 般 用 3 种 数据 结构 存储 图 , 即 邻接 和 矩阵、 邻接 表 、 链 式 前 向 星 。 

以 图 10. 1 所 示 的 有 向 图 为 例 , 图 中 有 6 个 结 点 ,11 条 边 。 

1. 邻接 矩阵 

用 二 维 数组 存储 即 可 : int graphLNUMJLNUMD。 

无 向 图 : graph[i][j] 二 graph[jj[i]。 

有 向 图 : graph[i[j]1 二 graph[jj[i]。 

权 值 : graph[i[jj 存 结 点 i 到 j 的 边 的 权 值 ,例如 
graph[1j[2] 二 3、graph[2j[1j]==5 等 。 用 graph[ij[;j==INF 表示 i 和 j 之 间 无 边 。 

优点 : 适合 稠密 图 ; 编码 非常 简短 ; 对 边 的 存储 、 查 询 、 更 新 等 操作 又 快 又 简单 ,只 需要 
一 步 就 能 访问 和 修改 。 

缺点 : 

(1) 存储 复杂 度 O(V? ) 太 高 。 如 果 用 来 存 稀 朴 图 ,大 量 空间 会 被 浪费 。 例 如 上 面 的 图 ， 
6 个 点 ,只 有 11 条 边 ,但 是 graph[6][L6] 的 空间 是 36。 当 VV 二 10 000 个 结 点 时 ,空间 为 
100MB ,已 经 超过 了 常见 ACM 竞赛 题 的 空间 限制 ,而 一 百 万 个 点 的 图 在 ACM 题 中 是 很 常 
见 的 。 

(2) 一 般 情 况 下 不 能 存储 重 边 。(x,v) 之 间 可 能 有 两 条 或 更 多 的 边 ,这 些 边 的 费用 不 
同 、 容 量 不 同 ,是 不 能 合并 的 。 有 向 边 (x,z) 在 矩阵 中 只 能 存储 一 个 参数 ,矩阵 本 身 的 局 限 


图 10.1 有 向 图 


闪光 和 
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性 使 它 不 能 存储 重 边 。 不 过 ,如 果 这 个 参数 值 只 是 用 来 表示 边 的 数量 ,也 算是 存储 了 重 边 。 
2. 邻接 表 
邻接 表 的 概念 请 阅读 (数据 结构 ?教材 ,规模 大 的 稀 琉 图 一 般 用 邻接 表 存 储 。 它 的 优点 
是 存储 效率 非常 高 ,只 需要 与 边 数 成 正比 的 空间 ,存储 复杂 度 为 O(V 十 E) ,几乎 已 经 达到 了 
最 优 的 复杂 度 ,而 且 能 存储 重 边 ; 缺点 是 编程 比邻 接 和 矩阵 麻烦 一 些 , 访 问 和 修改 也 慢 一 些 。 
在 本 章 “10. 9. 3 SPFA” 这 一 节 中 用 STL 的 vector 实现 了 邻接 表 , 有 关 代 码 如 下 : 


// 定 义 边 
struct edge{ 
int from, to, w; // 边 : 起 点 from, 终 点 to, 权 值 w 
edge( int a, int b, int c){from=a; to=b; w=c;} // 对 边 赋值 
}; 
vector < edge > e[ NUM]; //eli]: 存 第 i 个 结 点 连接 的 所 有 边 
// 初 始 化 


for(int i=1; i<=n; i++) 


e[il.clear(); 


// 存 边 
e[a]. push back(edge(a, b,c)); // 把 边 (a,b) 存 到 结 点 a 的 邻接 表 中 
// 检 索 结 点 u 的 所 有 邻居 


for(int i=0; i<e[ul].size(); i++){ // 结 点 的 邻居 有 e[u]. size() 个 


} 


例如 ,在 上 面 的 图 10. 1 中 , 结 点 2 的 邻接 表 是 (2 1 5) 一 (2 3 3) 一 (2 4 2) 一 (2 5 4)。 

3. 链 式 前 向 星 

用 邻接 表 存 图 非常 节省 空间 ,一般 的 大 图 也 够 用 了 。 然 而 ,如 果 空 间 极其 紧张 ,有 没有 
更 紧 姿 的 存 图 方法 呢 ? 邻接 表 有 没有 改进 的 空间 ? 

分 析 邻 接 表 的 组 成 ,存储 一 个 结 点 u 的 邻接 边 , 其 方法 的 关键 是 先 定位 第 1 个 边 ,第 1 
个 边 再 指向 第 2 个 边 ,第 2 个 边 再 指向 第 3 个 边 , 依 此 类 推 ,根据 这 个 分 析 , 可 以 设计 一 种 极 
为 紧 次、 没有 任何 空间 浪费 .编码 非常 简单 的 存 图 方法 。 图 10. 2 是 对 前 面 的 图 10. 1 生成 的 
存储 空间 ,其 中 ,head[NUM] 是 一 个 静态 数组 ,struct edge 是 一 个 结构 的 静态 数组 。 


bead[al [= | 3 | = 10 3 


2 4 6 8 
edge[ilto |2|1|2|13|13|14|14|1|15|15s | 6 
1 4 6 


edge[il].next | 一 


图 10.2 链 式 前 向 星 存 图 


以 结 点 2 为 例 , 从 点 2 出 发 的 边 有 4 条 , 即 (2,1)、(2,3)、(2,4)、(2,5) ,邻居 是 1、3、4、5。 
(1) 定位 第 1 个 边 。 用 head[ ] 数 组 实现 ,例如 head[2] 指 向 结 点 2 的 第 1 个 边 ,head[2]== 
8, 它 存储 在 edgeL8j 这 个 位 置 。 
» 216 。 


(2) 定位 其 他 边 。 用 struct edge 的 next 参数 指向 下 一 个 边 。edge[ 8]. next 二 6, 指 向 
下 一 个 边 在 edge[6] 这 个 位 置 ,然后 edge[ 6]. next 一 4.edge[4]. next 一 1, 最 后 edge[1] 
.next 一 一 1 ,一 1 表示 结束 。 

struct edge 的 to 参数 记录 这 个 边 的 邻居 结 点 。 例 如 edge[8]. to 一 5, 第 一 个 邻居 是 点 
5; 然后 edge[6]. to 二 4,edge[4]. to 二 3,edge[1]. to 二 1, 得 到 邻居 是 1、3、4、5。 

上 述 存储 方法 被 称 为 “ 链 式 前 向 星 ”, 它 是 空间 效率 最 高 的 存储 方法 ,因为 它 用 静态 数组 
模拟 邻接 表 , 没 有 任何 浪费 。 

那么 如 何 生成 上 述 的 存储 结果 ?下 面 的 程序 片段 来 自 后 面 SPFA 这 一 节 的 例子 。 每 执 
行 一 次 addedge() ,就 把 一 个 新 的 边 存 人 空间 。 

按 以 下 顺序 处 理 图 中 所 有 的 边 (u,v): (1,2)、(2,1)、(5,2)、(6,3)、(2,3)、(1,4)、(2， 
4)、(4,1)、(2,5)、(4,5)、(5,6) ,得 到 图 10.2。 输 入 的 顺序 会 影响 结果 。 

从 执行 过 程 可 知 , 每 加 入 一 个 新 的 边 ,都 是 直接 加 在 整个 edge[] 的 末尾 ,而 与 这 个 边 的 
特征 毫 无 关系 。 


下 面 是 程序 。 
const int NUM = 1000005; // 一 百 万 个 点 ,一 百 万 个 边 
struct Edge{ 
int to, next, w; // 边 : 终点 to、 权 值 w、 下 一 个 边 next. 起 点 放 在 head[ ] 中 
}edge[ NUM]; 
int head[ NUM]; //head[u] 指 向 结 点 u 的 第 一 个 边 的 存储 位 置 
int cnt; // 记 录 edge[ ] 的 末尾 位 置 ,新 加 入 的 边 放 在 末尾 
void init(){ // 初 始 化 
for(int i = 0; i< NUM; ++i){ 
edge[i].next = —1; /A/ -1: 结束 ,没有 下 一 个 边 
head[i] = -1; // -1: 不 存在 从 结 点 i 出 发 的 边 
} 
ent = 0 


} 
void addedge(int u, int v, int w){ 
edge[ cnt].to = v; 
edge[ cnt].w = w; 
edge[ cnt].next = head[u]; // 指 向 结 点 u 上 一 次 存 的 边 的 位 置 
head[u] = cnt++; // 更 新 结 点 Lu 最 新 边 的 存放 位 置 : 就 是 edge 的 末尾 


} 

// 人 遍历 结 点 i 的 所 有 邻居 

for(int i = head[u]; ~i; i = edge[i].next) //~~i 也 可 以 写成 i!= -1 
Te 


链 式 前 向 星 的 优点 是 存储 效率 高 ,程序 简单 .能 存储 重 边 ; 缺点 是 不 方便 做 删除 操作 。 
作为 练习 ,读者 可 以 自己 编写 删除 的 程序 。 
链 式 前 向 星 的 例 程 见 10.9 节 。 


10.3 图 的 遍历 和 连通 性 
图 的 基本 特征 是 点 和 边 ,图 的 基本 算法 是 用 搜索 来 处 理 点 和 边 的 关系 。 第 4 章 介 绍 了 


用 BFS 和 DFS 遍历 一 个 图 ,在 遍历 的 同时 也 解决 了 图 的 连通 性 问题 。BFS 和 DFS 是 图 论 
记过 和 有 
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的 基本 算法 ,本 章 大 部 分 内 容 是 基于 它们 的 。 这 些 算法 ,或 者 直接 用 BFS 和 DFS 来 解决 问 
题 ,或 者 用 其 思想 建立 新 的 算法 。 请 读者 回顾 BFS 和 DFS 的 内 容 , 透 彻 理解 并 能 熟练 写 出 
程序 。 

特别 是 DFS, 用 递归 来 搜索 图 , 比 BFS 更 难 理解 ; 但 是 一 旦 理解 之 后 ,编程 将 十 分 便 
利 。 图 论 中 的 很 多 算法 ,例如 拓扑 排序 、 强 连通 分 量 等 ,都 建立 在 DFS 之 上 。 

下 面 是 DFS 的 示例 程序 ,其 中 用 vector 邻接 表 来 存 图 。 用 和 矩阵 存 图 的 DFS 示例 见 第 4 章 。 


vector < int > G[N]; //S[u][i]: 第 u 个 结 点 直 连 的 第 i 个 结 点 

int vis[N]; // 点 的 访问 标志 ,vis = 0 表示 未 访问 过 
//vis = 1 表示 已 经 被 正常 处 理 过 
//vis= -1 表示 正在 被 访问 中 ,这 在 有 些 判断 中 有 用 
// 例 如 在 拓扑 排序 中 ,用 于 判断 跳出 死 循 环 


bool dfs(int u) { // 以 u 为 起 点 开始 DFS 搜索 
vis[u] = 1; // 在 本 次 递归 中 被 正常 访问 
{… ; return true;} // 出 现 目 标 状态 ,正确 返回 
{… ; return false;} // 做 相应 处 理 , 返 回 错误 
for(int i = 0; i<G[u].size(); i++ ) { //u 的 邻居 有 G[u].size() 个 
intv = G[u][il]; /人 是 第 并 个 邻居 
if(!vis[v]) // 如 果 v 没 有 访问 过 
return dfs(v); // 递 归 访 问 第 v 个 邻居 
} 
{… ;} // 事 后 处 理 , 返 回 正确 或 错误 


} 


下 面 用 图 10. 3 所 示 的 例子 来 帮助 读者 理解 DFS 在 图 中 的 应 用 。 这 个 例子 故意 设计 成 
非 连通 图 ,所 以 从 一 个 点 出 发 并 不 能 访问 到 所 有 点 。 

1. 求 某 个 点 的 连通 性 

对 需要 的 点 执行 dfs() ,就 能 找到 它 连通 的 点 。 例 如 找 图 10. 3 中 e 点 的 连通 性 ,执行 
dfs(e) ,访问 过 程 见 图 10. 4 结 点 上 面 的 数字 ,顺序 是 ebdca。 

递归 返回 的 结果 见 结 点 下 面 画 线 的 数字 ,顺序 是 acdbe。 虚 线 指向 的 结 点 表示 不 青 访 
问 ,因为 前 面 已 经 被 访问 过 。 


图 10.3 一 个 有 向 图 例子 图 10.4 dfs() 的 访问 顺序 


2. 重要 概念 

深 搜 优先 生成 树 : 上 面 DFS 的 结果 生成 了 一 棵 树 , 称 为 深 搜 优先 生成 树 (depth-first 
spanning tree) 。 

树 边 : 树 上 的 边 称 为 树 边 (tree edge) 。 

回 退 边 : 虚线 表示 的 边 (a,5) 称 为 回 退 边 (back edge) , 它 不 在 树 上 。 
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在 这 棵 树 上 ,从 起 点 到 其 他 任何 一 个 点 只 有 一 条 路 径 。 如 果 是 无 向 图 生成 的 树 ,那么 任 
意 两 个 点 之 间 只 有 一 条 路 径 。 

3. 用 dfs() 处 理 所 有 点 

夺目 经 常 需要 处 理 所 有 的 点 ,也 可 以 用 dfs() 实 现 。 其 思路 是 想象 有 一 个 虚拟 结 点 
它 连 接 了 所 有 的 点 ,那么 在 主 程序 中 这 样 进行 dfs(): 


for(int i=0; i<n; i++) 
dfs(i); 


读者 先 自己 思考 , 写 出 对 图 10.3 做 回 ， 
dfs() 的 过 程 ,然后 与 下 面 的 答案 对 照 。 

按 字母 顺序 执行 dfs() ,访问 过 程 见 上 
图 10.5 结 点 上 面 的 数字 ,顺序 是 加 后 i 
abdcefghi。 虚 线 指向 的 结 点 表示 不 再 ”视频 讲解 
访问 。 

递归 返回 的 结果 见 结 点 下 面 画 线 的 数字 ,顺序 是 
cdbaefhgi, 


图 10.5 dfs() 访 问 所 有 点 的 顺序 
请 读者 彻底 掌握 本 节 的 内 容 , 这 是 本 章 后 面 内 容 的 基础 。 


10.4 拓扑 排序 


BFS 和 DFS 的 一 个 直接 应 用 是 拓扑 排序 。 

在 现实 生活 中 ,人 们 经 常 要 做 一 连 串 事情 ,这 些 事情 之 间 有 顺序 关系 或 者 有 依赖 关系 ， 
在 做 一 件 事 情 之 前 必须 先 做 另 一 件 事 ,比如 安排 客人 的 座位 、 穿 衣服 的 先后 .课程 学 习 的 先 
后 等 。 这 些 事情 都 可 以 抽象 为 图 论 中 的 拓扑 排序 。 

1. 拓扑 排序 的 概念 

设 有 a.b、c.d 等 事情 ,其 中 a 有 最 高 优先 级 ,5b、c 优先 级 相同 ,d 是 最 低 优先 级 ,表示 为 
a 一 (bc) 一 d ,那么 abcd 或 acbd 都 是 可 行 的 排序 。 把 事情 看 成 图 的 点 ,把 先后 关系 看 成 有 
向 边 , 问 题 转化 为 在 图 中 求 一 个 有 先后 关系 的 排序 ,这 就 是 拓扑 排序 ,如 图 10.6 所 示 。 

显然 ,一 个 图 能 进行 拓扑 排序 的 充 要 条 件 是 它 是 一 个 有 向 无 环 图 (DAG)。 有 环 图 不 能 
进行 拓扑 排序 。 

2. 图 的 入 度 和 出 度 

拓扑 排序 需要 用 到 点 的 入 度 和 出 度 的 概念 。 

出 度 : 以 点 x 为 起 点 的 边 的 数量 称 为 x 的 出 度 。 

入 度 : 以 点 v 为 终点 的 边 的 数量 称 为 v 的 入 度 。 

一 个 点 的 入 度 和 出 度 体现 了 这 个 点 的 先后 关系 。 如 果 一 个 点 的 入 度 等 于 0, 则 说 明 它 
是 起 点 ,是 排 在 最 前 面 的 ; 如 果 它 的 出 度 等 于 0, 则 说 明 它 是 排 在 最 后 面 的 。 例 如 在 图 10.7 
中 ,点 ac 的 入 度 为 0, 它 们 都 是 优先 级 最 高 的 事情 ; d 的 出 度 为 0, 它 的 优先 级 最 低 。 
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拓扑 排序 可 以 有 多 个 ,例如 图 10.7 中 的 a 和 < , 谁 排 在 前 面 都 可 以 ,2 和 c 也是。 


(©) @ (© (a) 
图 10.6 用 图 表示 先后 关系 图 10.7 入 度 和 出 度 
拓扑 排序 用 BFS 或 者 DFS 都 能 实现 。 
3. 基于 BFS 的 拓扑 排序 
基于 BFS 的 拓扑 排序 有 两 种 思路 , 即 无 前 驱 的 顶点 优先 、 无 后 继 的 顶点 优先 。 


下 面 先 讲解 无 前 驱 的 顶点 优先 拓扑 排序 。 其 方法 是 先 输出 出 度 为 0( 无 前 驱 , 优 先 级 最 
高 ) 的 点 ,具体 操作 如 图 10. 8 所 示 , 其 中 Q 是 BFS 的 队列 : 


| SS @-- 0 RQ 
Re Se | 

四 BO 

(a) 进 a、 ec (b) 弹出 a， 进 b (0) 弹出 c (d) 弹出 bp， 进 d (e) 弹出 qd 


{ac} C={c,b} {hb} CO- 过 [ot 
图 10.8 无 前 驱 的 顶点 优先 拓扑 排序 


步 又 简 述 如 下 : 

(1) 找到 所 有 入 度 为 0 的 点 , 放 进 队列 ,作为 起 点 ,这 些 点 谁 先 谁 后 没有 关系 。 如 果 找 
不 到 入 度 为 0 的 点 ,说 明 这 个 图 不 是 DAG ,不 存在 拓扑 排序 。 图 10. 8(a) 中 ac 的 入 度 为 
0, 进 队列 。 

(2) 弹出 队 首 a,a 的 所 有 邻居 点 ,入 度 减 1, 把 入 度 减 为 0 的 邻居 点 5 放 进 队列 ,没有 减 
为 0 的 点 不 能 放 进 队列 。 内 容 见 图 10. 8(b)。 

(3) 继续 上 述 操作 ,直到 队列 为 空 。 内 容 见 图 10. 8(c) Cd) Ce) 。 

队列 输出 acbd, 而 且 包 含 了 所 有 的 点 ,这 就 是 一 个 拓扑 排序 。 

拓扑 排序 无 解 的 判断 : 如 果 队 列 已 空 ,但 是 还 有 点 未 进入 队列 ,那么 这 些 点 的 入 度 都 不 
是 0, 说 明 图 不 是 DAG ,不 存在 拓扑 排序 。 

以 上 是 “无 前 驱 ” 的 思路 。 读 者 很 容易 发 现 ,这 个 过 程 可 以 反 过 来 执行 , 即 “ 无 后 继 的 顶 
点 优先 ”: 从 出 度 为 0( 无 后 继 , 优 先 级 最 低 ) 的 点 开始 ,逐步 倒 推 。 其 示意 图 如 图 10. 9 所 示 ， 
请 读者 自己 分 析 过 程 。 最 后 输出 的 是 逆序 dbca。 


cx-9 or-9 Q--9 ec--9 ce 
© 3 eo- 0-W 60 60-Ww 


(a) 进 d (b) 弹出 4， 进 Pp、c (ec) 弹出 bp， 进 a (d) 弹出 c (e) 弹出 a 
(oath: {tbc} C=-{ca} C={a} wt 


图 10.9 无 后 继 的 顶点 优先 拓扑 排序 
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复杂 度 分 析 。 在 初始 化 时 ,查找 入 度 为 0 的 点 ,需要 检查 每 个 边 ,复杂 度 为 O(E); 在 队 
列 操作 中 ,每 个 点 进出 队列 一 次 ,需要 检查 它 直接 连接 的 所 有 邻居 ,复杂 度 是 O(V 十 E)。 其 
总 复杂 度 是 O(V 十 E)。 

4. 基于 DFS 搜索 的 拓扑 排序 


DFS 天 然 适合 拓扑 排序 。 

回顾 DFS 深度 搜索 的 原理 ,是 沿 着 一 条 路 径 一 直 搜 索 到 最 底层 ,然后 逐 层 回 退 。 这 个 
过 程 正好 体现 了 点 和 点 的 先后 关系 ,天 然 符合 拓扑 排序 的 原理 。 事 实 上 ,在 DFS 上 加 一 点 
点 处 理 就 能 解决 拓扑 排序 问题 。 

一 个 有 向 无 环 DAG 图 ,如 果 只 有 一 个 点 4 是 0 入 度 的 ,那么 从 wx 开始 DFS,DFS 递归 
返回 的 顺序 就 是 拓扑 排序 (是 一 个 逆序 ) 。DFS 递归 返回 的 首先 是 最 底层 的 点 , 它 一 定 是 0 
出 度 点 ,没有 后 续 点 ,是 拓扑 排序 的 最 后 一 个 点 ; 然后 逐步 回 退 ,最 后 输出 的 是 起 点 u; 输出 
的 顺序 是 一 个 逆序 。 

以 图 10. 10 为 例 , 从 a 开始 ,递归 返回 的 顺序 见 点 旁边 画 线 的 
数字 , 即 cdba, 是 拓扑 排序 的 逆序 。 

为 了 按 正确 的 顺序 打印 出 拓扑 排序 ,编程 时 的 处 理 是 定义 一 
个 拓扑 排序 队列 list, 每 次 递归 输出 的 时 候 把 它 插 到 当前 list 的 最 
前 面 , 最 后 从 头 到 尾 打印 list, 就 是 拓扑 排序 。 这 实际 上 是 一 个 栈 ， 
直接 用 STL 的 stack < int > 定义 栈 也 行 。 

读者 可 以 自己 画 个 DAG 图 ,体会 DFS 和 拓扑 排序 的 关系 。 

但 是 还 有 一 些 细节 需要 处 理 。 

(1) 应 该 以 人 度 为 0 的 点 为 起 点 开始 DFS。 如 何 找到 它 ? 需要 找到 它 吗 ? 如 果 有 多 个 
和 人 度 为 0 的 点 呢 ? 

这 几 个 问题 其 实 并 不 用 特别 处 理 。10. 3 节 已 介绍 了 这 个 做 法 : 想象 有 一 个 虚拟 的 点 
v, 它 单 向 连接 到 所 有 其 他 点 。 这 个 点 就 是 图 中 唯一 的 0 入 度 点 ,图 中 所 有 其 他 的 点 都 是 它 
的 下 一 层 递 归 , 而 且 它 不 会 把 原 图 变 成 环 路 。 从 这 个 虚拟 点 开始 DFS 就 完成 了 拓扑 排序 。 
例如 图 10.11(a) 有 两 个 0 入 度 点 a 和 f; 图 10.11(b) 想 象 有 个 虚拟 点 wu， 那么 递归 返回 的 顺 
序 见 点 旁边 画 线 的 数字 ,返回 的 是 拓扑 排序 的 逆序 。 


图 10.10 递归 和 拓扑 排序 


© 
Q_ Or 
问 
@ : 
(a) 有 多 个 0 入 度 点 的 图 (b) 递归 返回 的 顺序 


10.11 有 多 个 0 入 度 点 的 图 及 递归 返回 的 顺序 
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在 实际 编程 的 时 候 并 不 需要 处 理 这 个 虚拟 点 ,只 要 在 主 程序 中 把 每 个 点 轮流 执行 一 遍 
DFS 即 可 。 这 样 做 相当 于 显 式 地 递归 了 虚拟 点 的 所 有 下 一 层 点 。 

(2) 如 果 图 不 是 DAG ,能 判断 吗 ? 

图 不 是 DAG ,说 明 图 是 有 环 图 ,不 存在 拓扑 排序 。 那 么 在 递归 的 时 候 会 出 现 回 退 边 。 
如 果 读 者 不 理解 这 一 点 ,请 回顾 上 一 节 的 内 容 。 

在 程序 中 这 样 发 现 回 退 边 : 记录 每 个 点 的 状态 ,如 果 dfs() 递 归 到 某 个 点 时 发 现 它 仍 在 
前 面 的 递归 中 没有 处 理 完毕 ,说 明 存 在 回 退 边 ,不 存在 拓扑 排序 。 

5. 输出 字典 序 最 小 的 拓扑 排序 


由 于 一 个 图 的 拓扑 排序 有 很 多 ,题目 一 般 不 会 要 求 输出 所 有 的 ,而 是 输出 字典 序 最 小 的 
那 一 个 。 


hdu 1285“ 确 定 比赛 名 次 ” 
有 NN 个 比赛 队 进 行 比赛 ,编号 依次 为 1,2,…,N,1 三 N500。 上 比赛 结束 后 ,只 知道 
每 场 比赛 的 结果 。 请 编程 确定 排名 。 由 于 可 能 有 多 种 结果 ,输出 按 队 伍 编号 排序 最 小 
的 那个 排名 。 


思路 很 简单 : 在 当前 步骤 ,在 所 有 人 和 人 度 为 0 的 点 中 输出 编号 最 小 的 。 

先 考 虑 用 BFS 实现 。 

修改 BFS 的 拓扑 排序 程序 ,把 普通 队列 改 为 优先 队列 Q。 在 Q 中 放 进 入 度 为 0 的 点 ， 
每 次 输出 编号 最 小 的 结 点 ,然后 把 它 的 后 续 结 点 的 入 度 减 一 ,入 度 减 为 0 的 再 放 进 Q。 这 样 
就 能 输出 一 个 字典 序 最 小 的 拓扑 排序 。 图 10. 12 是 示例 。 


ss QO QO er--9 cc-9 
Sy 


(a) 进 a、c (b) 弹出 a， 进 b (©) 弹出 (d) 弹出 c， 进 4 (e) 弹出 qd 
{ac} {bc} Ot{c} OF- 过 [ot 
图 10.12 输出 字典 序 的 拓扑 排序 


如 果 不 用 优先 队列 找 最 小 的 点 ,而 是 用 暴力 查找 或 者 排序 算法 ,效率 会 比较 低 ,读者 可 
以 试 一 试 。 

用 DFS 可 以 输出 字典 序 吗 ? 思考 上 述 解 题 的 过 程 可 以 发 现 ,用 DFS 是 不 行 的 。 上 面 
处 理 的 过 程 相 当 于 把 点 按 优先 级 分 成 不 同 的 层次 ,在 每 个 层次 都 要 把 这 一 层 入 度 减 为 0 的 
点 按 大 小 顺序 输出 ; 而 DFS 是 深度 搜索 ,处 理 的 是 上 下 层 之 间 的 关系 ,不 能 处 理 这 种 同 层 
次 的 关系 。 读 者 可 以 自己 画 一 个 比较 复杂 的 多 层次 的 图 加 深 理解 。 


【习题 】 


poj 1270“Following Orders”, 按 字典 序 从 小 到 大 输出 所 有 拓扑 排序 。 这 一 题 很 重要 。 
hdu 3342 “Legal or Not”,hdu 2647“Reward”、hdu 5695“Gym Class” ,简单 拓扑 排序 。 


ss 


hdu 4857“ 逃 生 ”, 反 向 建 图 。 
hdu 1811“Rank of Tetris”, 并 查 集 十 拓扑 排序 。 


10.5 欧 拉 路 


欧 拉 路 是 简单 的 图 问题 ,和 拓扑 排序 一 样 ,也 用 DFS 直接 实现 。 

读者 小 时 候 可 能 玩 过 “一 笔画 ”游戏 ; 给 一 个 图 ,要 求 一 笔 连续 地 画 出 整个 图 ,必须 经 过 
每 条 边 , 并 且 只 能 经 过 一 次 ,点 可 以 重复 经 过 。 

这 个 问题 来 自 于 中 世纪 数学 家 欧 拉 的 七 桥 问题 。 这 条 一 笔画 路 线 称 为 欧 拉 路 。 如 果 还 
要 求 起 点 和 终点 相同 , 则 称 为 欧 拉 回路 。 

欧 拉 路 , 从 图 中 某 个 点 出 发 遍历 整个 图 ,图 中 的 每 条 边 通过 且 只 通过 一 次 。 

欧 拉 回 路 : 起 点 和 终点 相同 的 欧 拉 路 。 

欧 拉 路 问题 主要 有 两 个 , 即 是 否 存在 欧 拉 路 和 打印 出 欧 拉 路 。 问 题 的 解决 主要 通过 处 
理 度 (degree) 。 一 个 点 上 连接 的 边 的 数量 称 为 这 个 点 的 度数 。 在 无 向 图 中 ,如 果 度 数 是 奇 
数 ,这 个 点 称 为 奇 点 ,否则 称 为 偶 点 。 在 有 向 图 中 有 出 度 和 入 度 。 

1. 欧 拉 路 和 欧 拉 回路 是 否 存在 

首先 ,图 应 该 是 连通 图 。 在 编程 时 用 DFS 或 者 并 查 集 来 判断 连通 性 。 

其 次 ,判断 图 是 否 存在 欧 拉 路 或 欧 拉 回路 ， 

(1) 无 向 连通 图 的 判断 条 件 。 如 果 图 中 的 点 全 都 是 偶 点 , 则 存在 欧 拉 回路 ; 任意 一 点 
都 可 以 作为 起 点 和 终点 。 如 果 只 有 两 个 奇 点 , 则 存在 欧 拉 路 ,其 中 一 个 奇 点 是 起 点 , 另 一 个 
是 终点 。 不 可 能 出 现 有 奇数 个 奇 点 的 无 向 图 ,请 读者 思考 。 

(2) 有 向 连通 图 的 判断 条 件 。 把 一 个 点 上 的 出 度 记 为 1、 人 度 记 为 一 1, 这 个 点 上 所 有 的 
出 度 和 入 度 相 加 就 是 它 的 度数 。 一 个 有 向 图 存在 欧 拉 回路 , 当 且 仅 当 该 图 所 有 点 的 度数 为 
0。 如 果 只 有 一 个 度数 为 1 的 点 一 个 度数 为 一 1 的 点 ,其 他 所 有 点 的 度数 为 0, 那么 存在 欧 
拉 路 径 ,其 中 度数 为 1 的 是 起 点 .度数 为 一 1 的 是 终点 。 

下 面 用 一 个 简单 题 讲解 欧 拉 路 的 判断 。 


uva 10054 “The Necklace” 
有 nn 个 珠子 。 每 个 珠子 有 两 种 颜色 ,分 布 在 珠子 的 两 边 。 一 共有 50 种 不 同 的 颜色 。 
把 这 些 珠子 串 起 来 ,要 求 两 个 相 邻 的 珠子 接触 的 那 部 分 颜色 相同 。 问 是 否 能 连 成 一 个 
珠 串 项 链 ? 如 果 能 ,打印 一 种 连 法 。 


这 一 题 是 典型 的 无 向 图 求 欧 拉 回 路 。 

首先 ,判断 所 有 的 点 是 否 为 偶 点 ,如 果 存 在 奇 点 , 则 没有 欧 拉 回路 ; 其 次 ,判断 所 给 的 图 
是 否 连 通 ,不 连通 也 不 是 欧 拉 回路 。 

下 面 的 程序 只 判断 了 有 无 欧 拉 回路 。 关 于 连通 性 ,读者 可 以 自己 用 DFS 或 者 并 查 集 实 
现 ( 此 题 很 简单 , 没 用 到 DFS 和 并 查 集 ) 。 

这 一 题 需要 注意 的 是 可 能 有 重 边 , 即 邻居 点 uv 之 间 可 能 有 多 个 边 。 
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uva 10054 题 : 判断 欧 拉 回路 


for(i=1; i<=n; it+) { // 输 入 图 ,用 邻接 矩阵 G[ ][] 存 图 
scanf("%d%d", &u, &v); 
degree[u]++; 
degree[v]++; // 记 录 点 的 度 
Glul[lv]++; 
G[v][u]++; //0: 不 连接 ; 1: 连接 ; >1: 有 重 边 


由 
for(i=1; i<=n; i++) 


if(d[i] %2) break; // 存 在 奇 点 ,退出 ; 无 欧 拉 回 路 


2. 输出 一 个 欧 拉 回路 
对 一 个 无 向 连通 图 做 DFS 就 输出 了 一 个 欧 拉 回路 。 
uva 10054 题 : 输出 一 个 欧 拉 回路 


void euler(int u){ // 从 uu 开始 DFS 
int v; 
for(v=1; v<=50; v++) // 深 搜 u 的 所 有 邻居 


if(G[u][v]) { 

Glu][v] -—; G[v][u] -—; // 可 能 有 重 边 

euler(v); 

printf("%d %d\n", v, u); // 请 思考 为 什么 在 euler(v) 后 面 打 印 
} 


图 10. 13 可 以 帮助 读者 理解 上 面 的 程序 。 


(a) 原 图 (b) DFS 访 问 的 顺序 (ce) DFS 返回 的 顺序 
图 10.13 输出 一 个 欧 拉 回路 


从 图 10.13(a) 中 的 a 点 开始 DFS,DFS 的 对 象 是 边 。 图 10. 13(b) 边 上 的 数字 是 DFS 
访问 的 顺序 ,也 可 以 有 别 的 顺序 ,图 中 为 了 帮助 读者 理解 ,特意 选 了 一 个 不 太 “ 好 ”的 顺序 。 
图 10. 13(c) 边 上 夯 线 的 数字 是 DFS 返回 的 顺序 , 它 正好 是 一 个 欧 拉 回路 。 

程序 中 输出 的 路 径 实 际 上 是 从 终点 到 起 点 的 一 条 路 径 , 对 于 无 向 图 来 说 ,因为 起 点 和 终 
点 都 是 一 个 点 ,所 以 并 没有 关系 。 

如 果 是 有 向 图 ,那么 输出 的 是 一 个 逆序 的 路 径 , 可 以 用 栈 把 逆序 按 正 序 打印 出 来 ,参考 
“拓扑 排序 ”中 打印 路 径 时 对 栈 的 使 用 。 
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在 上 面 的 程序 中 ,图 是 用 邻接 矩阵 表示 的 。 作 为 练习 ,读者 可 以 用 邻接 表 重 写 程 序 。 
3. 用 非 递归 DFS 输出 欧 拉 回 路 
上 面 用 递归 实现 的 DFS 输出 欧 拉 回路 。 递 归 常 见 的 问题 是 爆 栈 , 如 果 数 据 很 大 ,就 不 


能 直接 用 递归 ,需要 自己 写 个 栈 模拟 递归 。 请 读者 练习 下 面 的 题目 。 和 
CD poj 1780*code”。 输 入 数字 位 数 ，, 输 出 一 申 数 字 , 其 中 包含 所 有 可 能 如 

的 二 位 数字 序列 ,而 且 只 包含 一 次 ; 用 字典 序 输出 。 和 
分 析 : 欧 拉 回 路 问题 。 但 是 一 107 ,会 爆 栈 。 ts: 


(2) hdu 4850“Wowl Such String!”。 用 26 个 小 写字 母 构 造 一 个 长 度 为 。 视频 讲解 
n 的 串 , 其 中 任意 长 度 为 4 的 子 串 都 不 相同 ; ”入 500 000。 

分 析 : 本 题 可 能 有 4” 个子 串 。 这 一 题 有 不 同 解法 ,如 果 用 DFS, 也 容易 爆 栈 。 

4. 混合 图 欧 拉 路 问题 

有 的 图 不 是 单纯 的 有 向 图 或 无 向 图 ,而 是 二 者 的 混合 ,同时 存在 有 向 边 和 无 向 边 。 这 是 
一 个 比较 困难 的 问题 ,需要 用 最 大 流 求解 ,具体 内 容 见 “10. 11. 3 Dinic 算法 和 ISAP 算法 ”。 


【习题 】 


hdu 1878“ 欧 拉 回 路 ”"。 判 断 是 否 存在 回路 ,无 向 图 。 

hdu 1116“Play on Words”。 首 尾 连 单词 ,有 向 图 ,可 以 分 别 用 DFS 和 并 查 集 判 断 连 
通 性 。 

hdu 5883“The Best Path”。 无 向 图 欧 拉 路 。 


10.6 无 向 图 的 连通 性 


10.6.1 割 点 和 割 边 


在 无 向 图 中 ,所 有 能 互通 的 点 组 成 了 一 个 “连通 分 量 ”。 在 一 个 连通 分 量 中 有 一 些 关 键 
的 点 ,如 果 删 除 它 , 会 把 这 个 连通 分 量 分 成 两 个 或 更 多 ,这 种 点 称 为 制 点 (Cut vertex) 。 

类 似 的 有 制 边 (Cut edge, 又 称 为 桥 ,bridge) 问 题 。 在 一 个 连通 分 量 中 ,如 果 删 除 一 个 
边 ,把 这 个 连通 分 量 分 成 了 两 个 ,这 个 边 称 为 割 边 。 

研究 割 点 和 制 边 是 很 有 意义 的 。 从 制 点 、 割 边 扩展 出 双 连 通 问 题 , 即 如 何 实现 一 个 没有 
割 点 和 割 边 的 图 。 例 如 在 计算 机 网 络 中 ,可 靠 性 是 重要 的 问题 ,希望 能 在 某 些 网 络 结 点 出 故 
障 的 情况 下 不 影响 整个 网 络 的 通畅 。 那 么 ,应 该 如 何 布置 网 络 才能 不 出 现 割 点 ,并 且 部 署 的 
结 点 最 少 ? 

本 节 先 研究 一 个 基本 问题 : 在 一 个 无 向 连通 图 G 中 有 多 少 个 割 点 ? 

暴力 方法 : 删除 每 个 点 ,然后 用 DFS 求 连通 性 ,如 果 连 通 分 量变 多 ,那么 就 是 制 点 。 其 
复杂 度 是 O(V(V 十 E)) ,不 是 好 算法 。 

下 面 介 绍 用 DFS 求 制 点 的 算法 , 即 利 用 “ 深 搜 优先 生成 树 ” 求 割 点 。 请 读者 先 回顾 
10. 3 节 的 概念 。 
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在 一 个 连通 分 量 G 中 ,对 任意 一 个 点 > 做 DFS, 能 访问 到 所 有 点 ,产生 一 棵 * 深 搜 优先 生 
成 树 " 工 。 那 么 对 G 求 割 点 ,和 了 有 什么 关系 呢 ? 

定理 10.1: T 的 根 结 点 :是 制 点 , 当 且 仅 当 :有 两 个 或 更 多 的 子 结 点 。 这 个 定理 很 容 
易 理 解 ,如 果 ; 是 制 点 , 它 会 把 图 分 成 不 相连 的 几 部 分 ,这 几 个 部 分 都 会 生成 子 树 ; 如 果 s 不 
是 制 点 , 它 只 会 连接 一 个 子 树 。 

读者 可 以 验证 图 10.14。 图 (b) 是 a 的 生成 树 ,a 点 是 割 点 , 它 有 子 结 点 5 和 c。 图 中 点 
上 面 的 数字 是 递归 的 顺序 ,下 面 画 线 的 数字 是 递归 返回 的 顺序 。 


CR 一世 1 


bo 
本 


o 


(a) 原 图 (b) 点 a 的 生成 树 
图 10.14 根 结 点 是 割 点 的 判断 


2 不 是 割 点 ,如 果 用 2 生成 树 , 只 有 一 个 子 结 点 a。 

定理 10.2: 工 的 非 根 结 点 x 是 割 点 , 当 且 仅 当 v 存在 一 个 子 结 点 vw,u 及 其 后 代 都 没有 
回 退 边 连 回 x 的 祖先 。 这 个 定理 也 容易 理解 ,如 果 w 是 制 点 , 它 会 把 图 分 成 两 部 分 或 更 多 ， 
其 中 至 少 一 个 后 代 肯 定 没有 通过 其 他 边 ( 回 退 边 , 即 绕 过 回去 的 边 ) 连 回 的 祖先 ,否则 图 
就 不 会 被 分 开 了 。 

例如 图 10. 14(b) 中 的 ec 点, 它 的 子 结 点 只 有 一 个 e, 而 e 后面 有 个 子 结 点 d 有 回 退 边 连 
回 了 根 结 点 a ,所 以 c 不 是 割 点 。 再 看 e 点 ,有 一 个 子 结 点 g, 没 有 回 退 边 连 回 e 的 祖先 ,所 
以 e 是 割 点 。 

如 何 编程 实现 定理 10. 2? 

设 x 的 一 个 直接 后 代 是 v。 

定义 num[uj, 记 录 DFS 对 每 个 点 的 访问 顺序 ,num 值 随 着 递 推 深度 增加 而 变 大 。 

定义 low[Lvj, 记 录 wv 和 w 的 后 代 能 连 回 到 的 祖先 的 num。 

只 要 low[v] 宇 num[u], 就 说 明 在 v 这 个 支 路 上 没有 回 退 边 连 回 x 的 祖先 ,最 多 退 到 v 
本 身 。 这 就 是 定理 10. 2。 

下 面 的 图 10. 15 是 例子 ,low[uj 的 初始 值 等 于 num[wj, 即 连 到 自己 。 图 10.15(a) 没 有 
回 退 边 。5。 的 后 代 是 c,low[c]j=3,num[LbO 一 2. 有 low[c] 三 num[Lo] ,说 明 2 的 支 路 c 上 没有 
回 退 边 连 回去 ,所 以 5 是 割 点 。 

在 图 10. 15(b) 中 ,观察 low[L] 是 如 何 更 新 的 。 最 后 访问 的 d 是 递归 最 深 处 的 点 , 它 的 
num[dj 二 4, 它 有 回 退 边 连 到 5b,lowLdj 的 初始 值 是 4, 更 新 为 lowLd] 一 num[b] 王 2, 表示 有 
回 退 边 到 5。 然后 d 递归 回 到 c ,low[c] 更 新 为 low[c]=low[d] 王 2, 表 示 c 通过 后 代 能 回 退 
到 65。 以 上 是 low[j 的 更 新 过 程 。 继 续 考 察 c: 由 于 low[Ldj 二 2,num[cj 二 3, 说 明 c 的 后 代 
d 有 回 退 边 连 到 了 c 的 祖先 ,所 以 c 不 是 割 点 。 
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num[] low[] 


(@) 1 

(@) 2 2 

(ce) ;3 3 

@ 4 4 

(a) 没有 回 退 边 的 图 


num[] low[] 


“@) 4 4->2 


(b) 有 回 退 边 的 图 


图 10.15 非 根 结 点 是 割 点 的 判断 


特别 有 意思 的 是 ,上 述 判断 割 点 的 条 件 low[v] 宇 num[u] 只 要 改 为 low[v]num[u] 就 
能 用 于 判断 割 边 。 这 表示 x 的 支 路 v 以 及 wv 的 后 代 只 能 回 退 到 vw ,而 到 不 了 vx, 那 么 边 (x,u) 
肯定 就 是 制 边 。 例 如 图 10. 15(b) 中 的 2 点 ,有 low[c]=2,num[LbO 一 2, 说 明 (0,c) 不 是 制 边 ; 


再 看 a 点 ,有 low[Lo=2,num[a]=1,low[LO 二 num[La]j, 所 以 (a,0) 是 制 边 。 


输入 一 个 无 向 图 , 求 害 点 的 数量 。 


程序 找到 所 有 关键 点 的 数量 。 


poj 1144“network” 


一 个 电话 线 公司 正在 建立 一 个 电话 线 缆 网 络 。 他 们 用 线 缆 连接 了 若干 个 地 点 ,这 
些 线 是 双向 的 ,每 个 地 点 都 有 一 个 电话 交换 机 。 从 每 个 地 点 都 能 通过 线 缆 到 达 其 他 任 
意 的 地 点 ,并 不 一 定 直接 连接 ,可 以 通过 若干 个 交换 机 来 到 达 目 的 地 。 有 时 候 某 个 地 点 
供电 出 问题 ,交换 机 会 停止 工作 。 工 作 人 员 意 识 到 ,除非 这 个 地 点 是 不 可 达 的 ,否则 它 


还 会 导致 一 些 其 他 的 地 点 不 能 互相 通信 。 称 这 个 地 点 为 关键 点 。 工 作 人 员 想 要 写 一 个 


在 下 面 的 程序 中 ,用 int dfn 记录 进入 递归 的 顺序 (也 称 为 时 间 蕉 ) ,然后 赋值 给 这 个 递 


归 中 点 4 的 num[uj。 


poj 1144 部 分 代码 


const int N = 109; 
int low[N], num[N], dfn; 
bool iscut[N]; 
vector < int > G[N]; 
void dfs(int u, int fa){ 
low[u] = num[u] = ++ dfn; 
int child = 0; 
for (int i = 0;i<G[ul].size(); i++){ 
intv = G[u][i]; 
if (!num[v]) { 
Child++ 7 
dfs(v, u); 
low[u] = min(low[v], low[u]); 
if (low[v] >= num[u] && u !=1) 
iscut[u] = true; 


//dfn 记录 递归 的 顺序 ,用 于 给 num 赋值 


// 存 图 

/人 u 的 父 结 点 是 fa 

// 初 始 值 

// 和 孩子 数目 

// 处 理 u 的 所 有 子 结 点 


/人 没 访问 过 


// 用 后 代 的 返回 值 更 新 low 值 


// 标 记 割 点 
入 这 8 和 
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} 
else if(nom[v] < num[u] && v != fa) 
// 处 理 回 退 边 ,注意 这 里 v != fa, fa 是 u 的 父 结 点 
//fa 也 是 u 的 邻居 ,但 是 前 面 已 经 访问 过 ,不 需要 处 理 它 
low[u] = min(low[u], num[v]); 
} 
if (u == 1 && child>=2) // 根 结 点 ,有 两 个 以 上 不 相连 的 子 树 
iscut[1] = true; 
' 
int main(){ 
int ans, n; 
// 在 这 里 输入 图 ,程序 略 
memset(low，0，sizeof(low) ); 
memset(num，0，sizeof(num) ) ; 
dfn = 0; 
memset(iscut, false, sizeof(iscut)); 
ans = 0; 
de(ty = dy //DFS 的 起 点 是 1 
for(int i=1;i<=nii++) ans+= iscut[i]; 
printf(" % d\n", ans); 
由 


判断 割 边 。 把 程序 中 的 让 (low[v] >= num[u] && nu 1!=1) 改 为 让 (low[Lv] 二 num[u] 
&& ul!=1), 其 他 程序 不 变 , 就 是 求 割 边 的 数量 。 


10.6.2 双 连 通 分 量 


在 一 个 连通 图 中 选任 意 两 点 ,如 果 它 们 之 间 至 少 存 在 两 条 “点 不 重复 ”的 路 径 , 称 为 点 双 
连通 。 一 个 图 中 的 点 双 连 通 极 大 子 图 称 为 “点 双 连 通 分 量 ”(block ,或 者 2-connected 
component)。 点 双 连 通 分 量 是 一 个 “可 靠 ” 的 图 ,去 掉 任意 一 个 点 ,其 他 点 仍然 是 连通 的 。 
也 就 是 说 ,点 双 连 通 分 量 中 没有 制 点 。 

类 似 地 有 “ 边 双 连 通 分 量 ”, 如 果 任 意 两 点 之 间 至 少 存在 两 条 “ 边 不 重复 ”的 路 径 , 称 为 
“ 边 双 连 通 ”。 在 边 双 连 通 图 中 去 掉 任意 一 个 边 , 图 仍然 是 连通 的 。 也 就 是 说 , 边 双 连通 图 中 
没有 制 边 。 

1. 点 双 连 通 分 量 

在 一 个 无 向 图 G 中 有 多 少 个 点 双 连 通 分 量 ? 

求解 点 双 连 通 分 量 和 求 割 点 密切 相关 。 不 同 的 点 双 连 通 分 量 最 多 只 有 一 个 公共 点 , 即 
某 一 个 割 点 ; 任意 一 个 割 点 都 是 至 少 两 个 点 双 连 通 分 量 的 公共 点 。 

计算 点 双 连 通 分 量 一 般 用 Tarjan 算法 0 了, 下 面 是 算法 的 思路 。 

前 面 讲解 了 如 何 用 DFS 进行 割 点 的 计算 ,可 以 发 现 .在 找到 一 个 割 点 的 时 候 已 经 完成 
了 一 次 对 某 个 极 大 点 双 连 通 子 图 的 访问 。 那 么 ,在 进行 DFS 的 过 程 中 ,把 遍历 过 的 点 保存 
起 来 ,就 可 以 得 到 这 个 点 双 连 通 分 量 。 


@ ”Tarjan 提出 了 很 多 算法 ,这 是 其 中 之 一 。 
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可 


DFS 的 访问 过 程 用 栈 来 保存 是 最 合理 的 ,所 以 ,在 求解 制 点 的 过 程 中 ,用 一 个 栈 保 存 遍 
历 过 的 边 , 然 后 每 当 找到 一 个 割 点 , 即 满 足 关 系 lowLv] > 一 num[uj 的 点 4, 就 将 栈 里 的 边 拿 
出 来 。 
注意 , 放 入 栈 中 的 不 是 点 ,而 是 边 。 因 为 一 个 边 只 属于 一 个 点 双 连 通 分 量 , 而 一 个 制 点 
属于 多 个 点 双 连 通 分 量 ,如 果 进 入 栈 中 的 是 点 ,这 个 割 点 弹出 来 之 后 就 只 能 给 一 个 点 双 连 通 
分 量 了 , 它 连接 的 其 他 点 双 连 通 分 量 就 会 少 了 这 个 点 。 


练习 题 ; poj 1523"SPF" ,一 个 图 中 有 多 少 个 割 点 ? 每 个 割 点 能 把 网 络 分 成 几 个 点 双 连 
通 分 量 ? 
2. 边 双 连 通 分 量 


给 定 一 个 图 G, 它 有 多 少 个 边 双 连通 分 量 ? 至 少 应 该 添加 多 少 条 边 ,才能 使 任意 两 个 边 
双 连 通 分 量 之 间 都 是 双 连 通 的 ,也 就 是 使 图 C 是 双 连 通 的 ? 


poj 3352 “Road Construction” 
给 定 一 个 无 向 图 G, 图 中 没有 重 边 。 问 添加 几 条 边 才能 使 无 向 图 变 成 边 双 连通 图 。 


边 双 连通 分 量 的 计算 用 到 了 “ 缩 点 ”的 技术 。 

(1) 首先 找 出 图 G 的 所 有 边 双 连通 分 量 。 

在 DFS 过程 中 ,图 G 所 有 的 点 都 生成 一 个 low 值 ,low 值 相同 的 点 必定 在 同一 个 边 双 
连通 分 量 中 。DFS 结束 后 ,有 多 少 low 值 就 有 多 少 个 边 双 连通 分 量 。 

(2) 把 每 一 个 边 双 连通 分 量 都 看 作 一 个 点 ， 
即 把 那些 low 值 相 同 的 点 合并 为 一 个 * 缩 点 ”。 这 
些 缩 点 形成 了 一 棵 树 ,例如 图 10. 16 。 

(3) 问题 被 转化 为 : 至 少 在 缩 点 树 上 增加 多 
少 条 边 才能 使 这 棵 树 变 为 一 个 边 双 连通 图 。 容 易 


推导 出 : 至 少 增加 的 边 数 = (总 度数 为 1 的 结 点 。 ”外 过 通 分 中 他 缩 点 图 
数 十 1)/2。 例 如 图 10. 16(b) 有 两 个 度数 为 1 的 10.16 边 双 连通 分 量 的 缩 点 
点 A.C, 至 少 增加 的 边 数 = 二 (2 十 1)/2==1。 

poj 3352 程序 


#include <cstring> 
# include < vector > 
# include < stdio.h> 
using namespace std; 
const int N = 1005; 
int n, m, low[N], dfn; 
vector < int > G[N]; // 存 图 
void dfs(int u, int fa){ // 计 算 每 个 点 的 low 值 
low[u] = ++dfn; 
for(int i=0;i<G[u]. size();i++){ 
intv = Glu][i]; 
if(v == fa) continue; 
if(!low[v]) 


"ss 
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dfs(v,u); 
low[u] = min(low[u], low[v]); 
} 
int tarjan(){ 
int degree[N]; // 计 算 每 个 缩 点 的 度数 
memset (degree, 0, sizeof(degree) ); 
for(int i=1; i<=n; i+t+) // 把 有 相同 low 值 的 点 看 成 一 个 缩 点 


for(int j=0; j<G[i].size(); j++) 
if(low[i] != low[G[i][j]]) 
degree[ low[ i]]++; 
int res= 0; 
for(int i=1;i<=n;it+) // 统 计 度 数 为 1 的 缩 点 的 个 数 
if(degree[i] ==1) res+t+; 
return res; 
下 
int main(){ 
while(~scanf("%d$%d", &n, gm)){ 
memset (low, 0, sizeof(low)); 
for(int i=0; i<=n; i++)  G[il].clear(); 
for(int i=1; i<=m; i++){ 
int a, b; 
scanf("%d%d", &a, &b); 
Gla].push back(b); G[b].push back(a); 
} 
dfn = 0; 
dFally = 
int ans = tarjan(); 
printf("% d\n", (ans + 1)/2); 
} 


return 0; 


【习题 】 


hdu 3394“Railway”, 点 双 连 通 分 量 。 

hdu 3749“Financial Crisis”, 点 双 连 通 分 量 。 
hdu 2460“Network”, 边 双 连 通 分 量 。 

hdu 4587 “TWO NODES”, 无 向 图 求 制 点 。 


10.7 有 向 图 的 连通 性 


本 节 的 内 容 与 拓扑 排序 的 思想 有 关 ,读者 在 阅读 之 前 请 先 认真 学 习 本 章 *10. 4 拓扑 排 
序 ” 的 内 容 。 
强 连通 。 在 有 向 图 G 中 ,如 果 两 个 点 u、v 是 互相 可 达 的 , 即 从 出 发 可 以 到 达 v, 从 vw 


< 


出 发 也 能 到 达 vw , 则 称 w 和 w 是 强 连通 的 。 如 果 G 中 的 任意 两 个 点 都 是 互相 可 达 的 , 称 G 是 
强 连 通 图 。 

强 连通 分 量 。 如 果 一 个 有 向 图 G 不 是 强 连 通 图 ,那么 可 以 把 它 分 成 多 个 子 图 ,其 中 每 
个 子 图 的 内 部 是 强 连 通 的 ,而 且 这 些 子 图 已 经 扩展 到 最 大 ,不 能 与 子 图 外 的 任意 点 强 连通 ， 
称 这 样 的 一 个 “ 极 大 强 连 通 ” 子 图 是 G 的 一 个 强 连通 分 量 (Strongly Connected Component， 
CGY 

一 个 常见 的 问题 : G 中 有 多 少 个 SCC? 在 解决 这 个 问题 之 前 需要 研究 SCC 的 特征 。 

(1) 出 度 和 入 度 。 一 个 点 必须 有 出 发 的 边 ,也 有 到 达 的 边 , 这 样 才 会 与 其 他 点 强 连 通 。 

(2) 把 一 个 SCC 从 G 中 挖 掉 , 不 影响 其 他 点 的 强 连通 性 。 可 以 把 图 上 的 一 个 个 SCC 想 
象 成 一 个 个 岛 , 岛 内 部 是 强 连通 的 ; 岛 之 间 只 有 单 向 道路 连接 ,不 会 形成 环 路 。 把 每 个 岛 虚 
拟 成 一 个 点 ,那么 所 有 这 些 虚 拟 点 构成 的 虚拟 图 是 一 个 有 向 无 环 图 DAG; 这 个 虚拟 DAG 
图 中 的 点 与 其 他 点 都 不 是 强 连 通 的 ,DAG 中 的 虚拟 点 的 数量 就 是 SCC 的 数量 , 如 
图 10. 17 所 示 。 可 以 推论 出 ,每 个 岛 都 可 以 挖 掉 ,而 不 会 影响 其 他 岛 内 部 的 连通 性 。 


(a) 原 图 (b) 虚拟 成 DAG 图 


图 10.17 SCC 的 虚拟 图 


用 暴力 的 方法 求 SCC 是 对 每 个 点 求 连通 性 ,然后 进行 比较 ,那些 互相 连通 的 点 就 组 成 
了 SCC。 这 可 以 通过 对 每 个 点 都 进行 DFS 或 者 BFS 搜索 得 到 ,例如 对 图 10. 17(a) 进行 搜 
索 的 结果 如 下 : 

分 别 从 avbvecsd 点 出 发 ,可 以 到 达 : {a.b,c,d); 

从 e 点 出 发 可 以 到 达 : {a,b,c,d,e}); 

从 了 点 出 发 可 以 到 达 : {a,b,c,d,e,f}。 

最 少 的 {a,b,c,d) 是 一 个 强 连通 分 量 , 从 整个 图 中 挖 掉 它 , 剩 下 最 小 的 是 {e}) ,再 挖 掉 它 ， 
最 后 是 {了 f}) ,得 到 3 个 SCC, 即 {a,b,csd}、{e}、{f}。 

暴力 法 的 复杂 度 是 O(V? 十 E)。 

求 SCC 有 3 种 高 效 算法 , 即 Kosaraju、Tarjan、Garbow, 它 们 的 复杂 度 都 是 OC(V 十 E)， 
但 Kosaraju 要 差 一 些 。 下 面 介 绍 Kosaraju、Tarjan 算法 。 


10.7.1 Kosaraju 算法 


Kosaraju 算法 用 到 了 “ 反 图 ”的 技术 ,基于 下 面 两 个 原理 : 

(1) 一 个 有 向 图 G, 把 G 所 有 的 边 反 向 ,建立 反 图 rG. 反 图 rG 不 会 改变 原 图 G 的 强 连 
通 性 。 也 就 是 说 ,图 G 的 SCC 数量 与 rG 的 SCC 数量 相同 。 这 里 直接 用 上 面 的 虚拟 DAG 
图 做 例子 ,图 10.18(a) 中 的 A、E、F 是 3 个 SCC, 内 部 的 点 都 是 强 连通 的 。 

(2) 对 原 图 G 和 反 图 rG 各 做 一 次 DFS, 可 以 确定 SCC 数量 。 
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对 原 图 G 做 DFS 是 为 了 确定 点 的 先后 顺 ®) 
序 。 可 以 发 现 ,对 生成 的 虚拟 DAG 图 ,可 以 用 
DFS 做 拓扑 排序 ,排序 结果 是 F.E、A( 不 过 ,此 《人 =S 
时 并 没有 确定 哪些 点 是 属于 A、E、F 的 )。 而 且 ， 人 
下 内 部 优先 级 最 高 的 那个 点 ,优先 级 高 于 天 、A 内 
部 所 有 的 点 ; 已 内 部 优先 级 最 高 的 那个 点 ,优先 
级 高 于 A 内 部 所 有 的 点 。 这 个 有 用 的 结果 将 用 or 
于 下 面 的 步骤 。 

确定 了 顺序 ,然后 从 优先 级 最 高 的 点 (这 个 点 属于 下 ) 开 始 , 在 反 图 上 做 DFS。 为 什么 要 
在 反 图 上 做 DFS? 这 样 做 可 以 求 得 被 隔离 的 “ 岛 "。 例 如 求 下 包含 哪些 点 , 想 办 法 把 下 和 其 
他 点 隔离 就 好 了 ; 原 图 中 下 是 只 有 出 度 的 点 , 改 成 反 图 后 ,F 变 成 了 只 有 入 度 的 点 ,那么 从 
下 出 发 做 DFS, 就 会 被 反 边 x、y 堵 住 ,DFS 搜索 到 的 点 被 限制 在 内。 显然 ,只 能 搜 到 并 且 
能 全 部 搜 到 下 内 部 的 点 ,而 无 法 到 达 A 、E, 这 样 就 确定 了 下 ,也 就 是 确定 了 第 1 个 SCC。 

下 一 步 , 删 除 下 ,然后 继续 在 剩 下 的 优先 级 最 高 的 点 开始 搜 ,这 一 步 搜 到 的 点 属于 EE, 而 
已 也 被 反 边 x 堵 住 ,只 能 搜 到 属于 的 点 ,确定 了 第 2 个 SCC。 最 后 ,删除 已, 确定 属于 A 
的 点 ,也 就 是 确定 了 第 3 个 SCC。 

算法 步骤 如 下 : 

(1) 在 G 上 做 一 次 DFS, 标 记 点 的 先后 顺序 。 在 DFS 的 过 程 中 标记 所 有 经 过 的 点 ,把 
递归 到 最 底层 的 那个 点 标记 为 最 小 ,然后 在 回 退 的 过 程 中 ,其 他 点 的 标记 逐个 递增 。 和 上 节 
拓扑 排序 中 的 DFS 操作 一 样 ,并 不 需要 找 一 个 特殊 的 点 作为 起 点 ,可 以 想象 有 一 个 起 点 w， 
v 连接 所 有 的 结 点 ,从 wv 开始 DFS。 

在 图 10.19(a) 中 ,从 虚拟 的 点 出 发 , 按 a.b、c、d、e、f 的 顺序 执行 DFS， 回 有 
DFS 返回 的 结果 是 cd、b、a、e、f; 每 个 点 的 大 小 标记 见 图 中 的 数字 。 如 果 搜 
索 顺 序 不 同 ,结果 也 会 不 同 ; 但 是 ,不 管 是 什么 顺序 ,f 的 标记 肯定 最 大 ,这 是 i 
拓扑 排序 的 原理 。 读 者 可 以 试 试 其 他 顺序 ,验证 这 个 结论 。 

(2) 在 反 图 rG 上 再 做 一 次 DFS, 顺 序 从 标记 最 大 的 点 开始 到 最 小 的 点 。 
首先 是 点 了 ,记录 所 有 它 能 到 达 的 点 ,这 些 点 组 成 了 第 1 个 SCC, 图 10. 19(b) 中 点 三 只 能 到 
达 自 己 ,这 是 第 1 个 SCC; 然后 删除 了 ,从 剩 下 的 最 大 的 点 继续 DFS, 这 次 是 点 e, 是 第 2 个 
SCC; 最 后 从 点 a 开始 搜 ,返回 {c,d,b,a}) ,这 是 第 3 个 SCC。 


(a) 原 图 G (b) 反 图 rG 


(a) 原 图 DFS (b) 反 图 DFS 
图 10.19 原 图 和 反 图 的 DFS 
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hdu 1269“ 迷 宫 城堡 ” 


一 个 有 向 图 ,及 nn 个 点 (n 三 10 000) 和 mm 条 边 (m 三 100 000)。 判 断 整个 图 是 否 强 连 


通 , 如 果 是 ,输出 Yes, 否 则 输出 No。 


hdu 1269 的 Kosaraju 算法 代码 了 


include < bits/stdc++.h> 
using namespace std; 

const int NUM = 10005; 
vector < int > G[ NUM], rG[NUM]; 


vector < int > 8; // 存 第 一 次 dfsl() 的 结果 : 标记 点 的 先后 顺序 


int vis[NUM], sccno[NUM], cnt; //cnt: 强 连 通 分 量 的 个 数 
void dfsl(int u) { 

if(vis[u]) return; 

vis[u] = 1; 

for(int i=0; i<G[u]. size(); it+) dfsi(G[u][i]); 


S. push_back(u); // 记 录 点 的 先后 顺序 ,标记 大 的 放 在 S 的 后 面 


} 
void dfs2(int u) { 
if(sccno[u]) return; 
sccno[u] = cnt; 
for(int i=0; i<rG[ul].size(); i++) dfs2(rG[u][i]); 
} 
void Kosaraju(int n) { 
cnt = 0; 
S.clear(); 
memset( sccno, 0, sizeof(sccno)); 
memset (vis, 0, sizeof(vis)); 
for(int i = 1; i<=n; i++) dfsl(i); // 点 的 编号 : 1~n. 递 归 所 有 点 
orlinb 3 = n= de L==) 
if(!sccno[S[i]]) {cnt++; dfs2(S[i]);} 
} 
int main(){ 
int nm ur vi 
while(scanf("%d%d", gn, gm), ni= 0||m!= 0) 1{ 
for(int i = 0; i<n; i++) {G[i].clear(); rG[il].clear();} 
for(int i = 0; i<m; i++){ 
scanf("%d%d", &u, &v); 
G[u].push_back(v); // 原 图 
rG[v]. push_back(u); // 反 图 
} 
Kosaraju(n); 
printf("% s\n", cnt == 1? "Yes" : "No"); 
} 


return 0; 


外 ”部 分 代码 参考 (算法 竞赛 入 门 经 典 训练 指南 ), 刘 汝 佳 ,清华 大 学 出 版 社 ,320 页 。 


"233 5 


算法 竞赛 入 门 到 进 阶 


该 程序 用 cnt 记录 SCC 的 数量 ,并且 统计 了 每 个 点 所 属 的 SCC, sccno[i 是 第 i 个 点 所 
属 的 SCC。 在 dfs2 〇 中 ,sceno[ 让 也 被 用 于 记录 点 i 是 否 被 访问 ,如 果 sccno[Lz] 不 等 于 0, 说 
明 它 已 经 被 处 理 过 ; 在 dfs10 〇 中 ,用 vis[ 疏 记录 点 i 是否 被 访问 。 

Kosaraju 算法 的 复杂 度 是 O(V 十 E)。 


10.7.2 Tarjan 算法 


上 面 的 Kosaraju 算法 ,其 做 法 是 从 图 中 一 个 一 个 地 把 SCC* 挖 ”出 来 。Tarjan 算法 能 在 
一 次 DFS 中 把 所 有 点 都 按 SCC 分 开 。 这 并 不 是 不 可 思议 的 , 它 利 用 了 SCC 的 如 下 特点 。 

定理 10. 3: 一 个 SCC, 从 其 中 任何 一 个 点 出 发 ,都 至 少 有 一 条 路 径 能 绕 回 到 自己 。 

在 继续 讲解 之 前 ,请 读者 先 回顾 无 向 图 DFS 中 求 割 点 的 low[] 和 num[] 操 作 。Tarjan 
算法 用 到 了 同样 的 技术 ,这 个 技术 结合 定理 10. 3 就 是 Tarjan 算法 。 

下 面 是 例子 ,图 10. 20 中 有 3 个 SCC, 即 {a,b,d,c}、{e}、{f}。 


(a) 原 图 (b) 对 图 做 DFS 


图 10.20 SCC 的 low[C] 和 num[] 操 作 


图 10. 20(a) 是 原 图 。 图 (b) 对 它 做 DFS, 每 个 点 左边 的 数字 标记 了 DFS 访问 它 的 顺 
序 , 即 num[] 值 ,右边 的 画 线 数字 是 low[] 值 , 即 能 返回 到 的 最 远 祖先 。 每 个 点 的 low[ ] 初 
始 值 等 于 num[], 即 连 到 自己 。 观 察 c 的 low[] 值 是 如 何 更 新 的 : 它 的 初始 值 是 6, 然 后 有 
一 个 回 退 边 到 a, 所 以 更 新 为 1; 它 的 递归 祖先 db 的 low[] 值 也 跟着 更 新 为 1。e 入 的 
low[] 值 不 能 更 新 。 

图 10.20(b) 是 从 a 开始 DFS 的 ,a 成 为 fa,o,d,c} 这 个 SCC 的 共同 祖先 。 其 实 , 从 {a， 
0,d,c} 中 任意 一 个 点 开始 DFS, 这 个 点 都 会 成 为 这 个 SCC 的 祖先 。 认 识 到 这 些 , 可 以 帮助 
读者 理解 后 面 的 解释 : 可 以 用 栈 分 离 不 同 的 SCC。 

图 10. 20(b) 中 的 low[] 值 有 3 个 部 分 , 即 等 于 1 的 {a,6b,d,c)、 等 于 4 的 {f})、 等 于 5 的 
{e}。 这 就 是 3 个 SCC。 

完成 以 上 步骤 ,似乎 已 经 解决 了 问题 。 每 个 点 都 有 了 自 Pa 
己 的 low[] 值 ,相同 low[] 值 的 点 属于 一 个 SCC。 那 么 只 要 青 。 ,和 ~- rg 
对 所 有 点 做 一 个 查询 , 按 low[] 值 分 开 就 行 了 ,其 复杂 度 是 时 Ma 
OKV) 。 其 实 有 更 好 的 办 法 , 即 在 DFS 的 同时 把 点 按 SCC( 有 \、@--O、 


相同 的 lowL] 值 ) 分 开 。 
以 图 10. 21 为 例 ,其 中 有 3 个 SCC, 即 A、E、F。 假设 从 i 
下 中 的 一 个 点 开始 DFS,DFS 过 程 可 能 会 中 途 跳 出 下 , 转 入 A 图 10.21 把 图 分 成 多 个 SCC 


*， 234. 


或 者 已 ,总 之 ,最 后 会 进 人 一 个 SCC。 

(1) 假设 DFS 过 程 是 F>E 一 A, 最 后 进入 A。 

(2) 在 A 这 个 SCC 中 将 完成 A 内 所 有 点 的 DFS 过 程 ,也 就 是 说 ,最 后 的 几 步 DFS 会 
集中 在 A 中 的 点 a、b、c.d。 这 几 个 点 会 计算 得 到 相同 的 low[] 值 ,标记 为 一 个 SCC, 这 样 就 
好 了 。 

(3) DFS 递归 从 A 回 到 EE, 并 在 EE 中 完成 E 内 部 点 的 DFS 过 程 。 

(4) 回 到 下 ,在 下 内 完成 递归 过 程 。 

以 上 过 程 如 何 编程 ”读者 能 想起 来 ,DFS 搜索 是 用 递归 实现 的 ,而 递归 和 栈 这 种 数据 
结构 在 本 质 上 是 一 致 的 。 所 以 ,可 以 用 栈 来 帮助 处 理 : 

(1) 从 下 开始 递归 搜索 ,访问 到 的 某 些 点 进入 栈 ; 

(2) 正中 的 某 些 点 进入 栈 ; 

(3) 在 DFS 的 最 底层 ,A 的 所 有 点 将 被 访问 到 并 进入 栈 , 当前 栈 顶 的 几 个 元 素 就 是 A 
的 点 ,标记 为 同一 个 SCC ,并 弹出 栈 ; 

(4) DFS 回 到 EE, 在 EE 中 完成 所 有 点 的 搜索 并 且 入 栈 , 当 前 栈 顶 的 几 个 元 素 就 是 玉 的 
点 ,标记 为 同一 个 SCC, 并 弹出 栈 ; 

(5) 回 到 下 ,完成 下 的 所 有 点 的 搜索 并 且 入 栈 , 当 前 栈 顶 的 几 个 元 素 就 是 的 点 ,标记 
为 同一 个 SCC ,并 弹出 栈 。 结 束 。 

为 加 深 对 上 述 过 程 中 栈 的 理解 ,读者 可 以 思考 最 先进 入 栈 的 点 。 每 进入 一 个 新 的 
SCC ,访问 并 人 栈 的 第 一 个 点 都 是 这 个 SCC 的 祖先 , 它 的 num[] 值 等 于 low[] 值 ,这 个 SCC 
中 所 有 点 的 low] 值 都 等 于 它 。 

仍然 以 hdu 1269 题 为 例 ,给 出 Tarjan 算法 代码 。 程 序 中 用 一 个 数组 int stack[ NJ 模拟 
栈 , 读 者 可 以 尝试 直接 用 STL 的 stack < int > 定义 栈 。 


hdu 1269 的 Tarjan 算法 代码 


include < bits/stdc++.h> 
using namespace std; 
const int N = 10005; 


int cnt; // 强 连通 分 量 的 个 数 
int low[N], num[N], dfn; 
int sccno[ N], stack[N], top; // 用 stack[ ] 处 理 栈 ,top 是 栈 顶 


vector < int > G[N]; 
void dfs(int u){ 
stack[top++] = ui //u 进 栈 
low[u] = num[u] = ++dfn; 
for(int i=0; i<G[u]. size(); ++i){ 
intv = Glu][il]; 
if(!num[v]){ // 未 访问 过 的 点 ,继续 DFS 
dfs(v); //DES 的 最 底层 ,是 最 后 一 个 SCC 
low[u] = min(low[v], low[u]); 
} 
else if(!sccno[v]) // 处 理 回 退 边 
low[u] = min(low[u], num[v]); 
} 
if(low[u] == num[u]){ // 栈 底 的 点 是 SCC 的 祖先 , 它 的 low = num 


“235 * 


算法 竞赛 入 门 到 进 阶 


centtt; 
while(1){ 
int v = stack[ -- top]; //v 弹 出 栈 
sccno[v] = cnt; 
if(u==v) break; // 栈 底 的 点 是 Scc 的 祖先 
} 
} 
} 
void Tarjan( int n){ 
cnt = top = dfn = 0; 
memset( sccno, 0, sizeof( sccno) ); 
memset (num, 0, sizeof(num) ) ; 
memset( low, 0, sizeof (low)); 
for(int i=1; i<=n; i++) 
if(!num[i]) 
dfs(i); 
yD 
int main(){ 
int n,m, u,v; 
while(scanf("%d%d", gn, gm), n!= 0||m!= 0){ 


for(int i=1; i<=n; i++){fG[i].clear( 

for(int i=0; i<m; i++){ 
scanf("%d%d", &u, &v); 
G[u].push back(v); 

’ 


Tarjan(n); 

printf("% s\n", cnt == 1? "Yes" : 
} 
return 0; 


} 


);} 


"No"); 


Tarjan 算法 的 复杂 度 也 是 O(V 十 E) ,但 是 它 只 做 了 一 次 DFS, 比 Kosaraju 算法 快 。 


【习题 】 


hdu 1827“Summer Holiday”, Tarjan 缩 点 。 


hdu 3072“Intelligence System”, Tarjan 十 贪心 。 
hdu 3836“Equivalent Sets”, 给 定 有 向 图 ,至 少 要 添加 多 少 条 边 才 能 成 为 强 连通 图 ? 
hdu 3639“Hawk-and-Chicken”, 强 连通 分 量 十 缩 点 。 


hdu 3861 “The King's Problem” ,Tarjant} 


最 小 路 径 覆 盖 。 


hdu 1530“Maximum Clique”, 最 大 团 简 单 题目 。 强 连通 分 量 的 一 个 应 用 是 最 大 团 问 题 


(Maximum Clique Problem,MCP) 。 


10.8 2-SAT 问题 


2-SAT 问题 可 以 用 强 连 通 分 量 和 拓扑 排序 解决 。 


先 用 一 个 例子 说 明 什么 是 2-SAT 问题 。 
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hdu 3062“Party” 
有 交 对 夫妻 被 邀请 参加 一 个 聚会 ,每 对 夫妻 中 只 有 1 人 可 以 列席 。 在 27 个 人 中 , 某 
些 人 (不 包括 夫妻 ) 之 间 有 着 很 大 的 矛盾 ,有 矛盾 的 两 个 人 不 会 同时 出 现在 聚会 上 。 问 
有 没有 可 能 让 姥 个 人 同时 列席 ? 


1. 数字 逻辑 的 解法 

如 果 学 过 计算 机 系 的 大 二 课程 “数字 逻辑 ”, 可 以 用 卡 诺 图 帮助 理解 这 个 
题目 。 

输入 样 例 : 有 3 对 夫妻 A( 包 括 A 男 和 A4A 女 ,B 和 C 也 是 )、.B.C, 其 中 A 人 
男 和 B 女 有 矛盾 ,A 女 和 C 女 有 矛盾 ,A 男 和 C 男 有 矛盾 。 

输出 : 所 有 合法 的 出 席 情况 。 

分 析 如 下 : 


(1) 夫妻 不 同时 出 席 。 例 如 ,第 A 对 夫妻 , 均 夫 是 A ,妻子 是 A, 因为 夫妻 不 同时 出 席 ， 
所 以 互 为 反 变 量 ?。 

(2) 不 同 夫妻 的 限制 条 件 。 例 如 ,A 男 和 B 女 (B Nec 
女 用 巨 表示 ) 有 了 矛盾 , 即 A 和 不 会 同时 出 现 ,有 360 人 
AB=0。 一 共有 3 个 限制 : AB=0,AC=0,AC=0。 ol oo 11 
用 卡 诺 图 表示 ,图 10.22(a) 中 的 5 个 0 是 3 个 限制 填 1 To lililo 
图 的 结果 。 10|o |o0 10|0 |0 

图 10.22(b) 中 等 于 1 的 方 格 就 是 可 行 的 答案 ,一 人 限制 条 件 (b) 完整 卡 诺 图 


共有 3 个 1: ABC、.ABC、ABC。 也 就 是 3 个 合法 出 席 
方案 , A 女 十 B 女 十 C 男 ,A 女 十 B 男 十 C 男 ,A 男 十 
B 男 十 C 女 。 

2-SAT 的 可 行 解 有 多 少 个 ?在 上 面 卡 诺 图 的 图 解 中 可 以 发 现 , 卡 诺 图 的 方 格 有 2" 个， 
也 就 是 说 ,可 行 解 的 数量 是 O(2") 的 ,复杂 度 很 高 ,所 以 一 般 不 会 要 求 输出 所 有 的 解 ,只 需要 
判断 序列 是 否 存 在 ,或 者 只 输出 一 个 可 行 解 。 

2. 2-SAT 问题 的 定义 

根据 上 面 的 例子 ,给 出 SAT 问题 的 定义 , 它 本 身 是 一 个 数字 逻辑 问题 : 及 个 布尔 变 
量 ( 布 尔 变量 的 特点 是 只 有 0、1 两 个 值 ) ,其 中 一 些 布尔 变量 之 间 有 限制 关系 ; 用 所 有 个 
布尔 变量 组 成 序列 ,使 得 其 满足 所 有 限制 关系 ; 判断 序列 是 否 存在 。 这 就 是 SAT 
(Satisfiability) 问 题 。 如 果 每 个 限制 关系 只 涉及 两 个 变量 , 则 是 2-SAT 问题 。 

3. 用 图 论 的 方法 解决 2-SAT 问题 

(1) 首先 ,把 矛盾 关系 用 图 来 表示 。 

举 一 个 简单 例子 。 有 两 对 夫妻 A、B, 有 两 个 限制 : A、B 了 矛盾 ,A、 忆 矛盾 。 

先 看 A、B 的 矛盾 ,有 两 个 推论 : 如 果 A 确定 出 席 . 那 么 只 能 B 出 席 ,用 A 一 B 表示 , 表 


图 10.22 用 卡 诺 图 求解 2-SAT 问题 


@ 在 数字 逻辑 中 有 3 种 基本 远 辑 操作 , 即 与 或 . 非 。 非 : A 是 A 的 反 变 量 . 或 : 4A+A=1。 与 : AA 一 0。 
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示 “ 有 A 必 有 B”; 如 果 B 确定 出 席 , 只 能 A 出 席 , 用 B-~A 表示 。 
A、B 这 一 对 矛盾 ,推出 了 两 个 结果 ,这 是 因为 A、B 是 对 等 的 ,所 以 产生 的 关系 是 对 称 
的 。 见 下 面 的 有 向 图 10. 23(a)。 


OO ©® @-—{® 
(a) 4、B 有 矛盾 (b)4、B 予 盾 (0) 合 起 来 


10.23 用 图 表示 A、B 的 矛盾 关系 


同样 ,A .也 矛盾 ,推论 是 A 一 B、B-~A, 见 有 向 图 10. 23(b)( 可 以 观察 到 ,这 里 推论 出 A、 
了 同时 出 席 , 和 前 一 个 限制 正好 矛盾 ) 。 

两 个 限制 合 起 来 的 有 向 图 是 图 10. 23(c) 。 这 个 有 向 图 的 点 包含 了 所 有 人 ,有 向 边 说 明 
了 依赖 关系 。 

(2) 合法 的 出 席 组 合 和 强 连通 分 量 SCC 的 关系 。 

在 最 后 的 图 10.23(c) 中 ,形成 了 多 个 强 连 通 分 量 SCC。 一 个 SCC 内 部 的 点 都 是 互相 依 
赖 的 ,也 就 是 说 ,如 果 有 一 个 出 席 , 那 么 这 个 SCC 内 部 的 所 有 人 都 要 出 席 。 所 以 ,一 个 SCC 
内 部 不 应 该 有 夫妻 关系 ,因为 夫妻 只 能 出 席 一 人 。 只 要 所 有 的 SCC 内 部 都 没有 夫妻 ,就 会 
有 合法 的 出 席 组 合 。 为 深入 理解 这 一 点 ,读者 可 以 观察 图 10. 23(c), 所 有 的 点 都 不 是 强 连 
通 的 ,每 个 点 都 是 独立 的 SCC, 所 以 这 个 图 有 合法 的 解 。 特 别 要 注意 其 中 有 A 一 BA, 但 A 
和 A 并 不 是 强 连通 的 。 

所 以 ,程序 的 步骤 是 根据 给 定 的 限制 条 件 建 图 ,计算 SCC, 如 果 每 个 SCC 内 都 没有 夫 
妻 ,就 说 明 有 合法 的 出 席 组 合 。 

(3) 在 图 上 求解 一 个 合法 组 合 。 作 为 参照 ,读者 可 以 先 用 上 面 卡 诺 图 的 方法 得 出 有 
AB、AB 两 种 出 席 组 合 。 

读者 可 能 觉得 ,只 要 在 图 10. 23(c) 中 沿 着 一 条 路 径 按 顺序 找 , 就 能 找到 一 个 合法 组 合 ， 
因为 一 条 路 径 上 前 后 的 点 都 是 相互 依赖 的 。 但 是 ,其 实 这 个 从 前 到 后 的 顺序 是 不 对 的 ,应 该 
按 反 序 找 , 即 从 最 后 的 点 开始 往 前 ,这 才 是 对 的 。 这 是 因为 最 后 的 点 是 依赖 性 最 大 的 ,例如 
图 10.23(c) 中 的 A, 它 被 前 面 的 B 和 B 所 依赖 。 

把 每 个 SCC 看 成 一 个 点 ,构成 了 一 个 DAG 图 ,进行 反 图 的 拓扑 排序 ,在 选中 点 的 时 候 
同时 排除 图 中 相 矛 盾 的 点 ,就 能 找到 合法 的 组 合 。 

在 编程 时 并 不 需要 再 做 一 次 拓扑 排序 。 在 求 SCC 时 已 经 得 到 了 每 个 点 所 属 的 SCC， 
SCC 的 序号 就 是 一 个 拓扑 排序 。 


【习题 】 


hdu 3062“Party”,2-SAT 简单 题 。 
hdu 1824“Let's go home”, 简 单 题 。 
hdu 4115 “Eliminate the Conflict”。 
hdu 4421 “Bit Magic”。 
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10.9 最 短 路 


最 短路 径 是 图 论 中 最 为 人 们 熟知 的 问题 。 

1. 最 短路 径 问 题 

在 一 个 图 中 有 个 点 、m 条 边 。 边 有 权 值 ,例如 费用 ,长 度 等 , 权 值 可 正 可 负 。 边 可 能 是 
有 向 的 ,也 可 能 是 无 向 的 。 给 定 两 个 点 ,起 点 是 ;, 终 点 是 1, 在 所 有 能 连接 ; 和 + 的 路 径 中 寻 
找 边 的 权 值 之 和 最 小 的 路 径 , 这 就 是 最 短路 径 问题 。 

2. 可 加 性 参数 和 最 小 性 参数 

这 两 种 参数 区 分 了 最 短路 径 问题 和 网 络 流 问题 。 

在 最 短路 径 问题 中 ,是 计算 “路 径 上 边 的 权 值 之 和 ”。 边 的 权 值 是 可 加 性 参数 ”, 例 如 费 
用 、 长 度 等 ,它们 是 “可 加 的 ”, 一 条 路 径 上 的 总 权 值 是 这 条 路 径 上 所 有 边 的 权 值 之 和 。 下 一 
节 的 “最 小 生成 树 ” 问 题 , 边 的 权 值 也 是 “可 加 性 参数 ”。 

但 是 ,在 网 络 流 问 题 中 是 找 “ 路 径 上 权 值 最 小 的 边 ”。 例 如 “最 大 流 ” 问 题 , 边 的 权 值 是 
“最 小 性 参数 ”"。 比 如 水 流 ,一 条 路 径 上 的 能 流 过 的 水 流 取决 于 这 条 路 径 上 容量 最 小 的 那 条 
边 。 再 比如 网 络 的 带宽 ,一 条 网 络 路 径 上 的 整体 带宽 是 这 条 路 径 上 带宽 最 小 的 那 条 边 的 
带宽 。 

3. 用 DFS 搜索 所 有 的 路 径 

在 一 般 的 图 中 , 求 图 中 任意 两 点 间 的 最 短路 径 , 首 先 需 要 遍历 所 有 可 能 经 过 的 结 点 和 
边 ,不 能 有 遗漏 ， 其 次 ,在 所 有 可 能 的 路 径 中 查找 最 短 的 一 条 。 如 果 用 暴力 法 找 所 有 路 径 ， 
最 简单 的 方法 是 把 个 结 点 进行 全 排列 ,然后 从 中 找到 最 短 的 。 但 是 共有 nl! 个 排列 ,是 天 
文 数字 ,无 法 求解 。 更 好 的 办 法 是 用 DFS 输出 所 有 存在 的 路 径 ,这 显然 比 n! 要 少 得 多 ,不 
过 ,其 复杂 度 仍然 是 指数 级 的 。 

4. 用 BFS 求 最 短路 径 

在 特殊 的 地 图 中 ,所 有 的 边 都 是 无 权 的 ,可 以 把 每 个 边 的 权 值 都 设 成 1, 那么 BFS 也 是 
很 好 的 最 短路 径 算法 ,这 些 内 容 在 4. 3. 3 节 中 已 经 提 到 ,请 读者 回顾 有 关内 容 。 

下 面 讲解 常见 的 4 个 最 短路 径 算法 。 这 几 种 方法 差别 很 大 ,如 果 读 者 不 能 理解 其 思想 ， 
学 起 来 容易 头 量 。 为 清晰 地 讲解 这 些 算 法 ,本 书 从 3 个 方面 展开 : 先 结合 现实 中 的 模型 讲 
解 算法 的 思想 ; 然后 解释 编程 的 逻辑 过 程 ; 最 后 给 出 标准 程序 ,这 些 程序 结合 了 不 同 的 数 
据 结构 和 STL 库 。 

最 短路 径 的 4 个 常用 算法 是 Floyd、Bellman-Ford、SPFA、Dijkstra。 在 不 同 的 应 用 场景 
下 ,用 户 应 该 有 选择 地 使 用 它们 : 

(1) 图 的 规模 小 ,用 Floyd。 如 果 边 的 权 值 有 负数 ,需要 判断 负 圈 。 

(2) 图 的 规模 大 , 且 边 的 权 值 非 负 ,用 Dijkstra。 

(3) 图 的 规模 大 , 且 边 的 权 值 有 负数 ,用 SPFA。 需 要 判断 负 圈 。 

再 具体 一 点 ,可 以 总 结 出 表 10. 1。 
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表 10.1 对 比 4 种 常用 算法 


结 点 nn、 边 m 边 权 值 选用 算法 数据 结构 

n<200 允许 有 负 Floyd 邻接 矩阵 

nXm<10" 允许 有 负 Bellman-Ford 邻接 表 

更 大 有 负 SPFA 邻接 表 、 前 向 星 
无 负数 Dijkstra 邻接 表 、 前 向 星 


本 节 后 面 的 讲解 都 以 基础 题 hdu 2544 为 例 , 讲 解 不 同 算法 的 思想 ,并 给 出 模板 代码 。 


hdu 2544“ 最 短路 径 ” 
把 衣服 从 商店 运 到 赛场 ,寻找 从 商店 到 赛场 的 最 短路 径 线 。 
有 N 个 路 口 ,标号 为 1 的 路 口 是 商 店 所 在 地 ,标号 为 N 的 路 口 是 赛 场所 在 地 。 有 
M 条 路 ,每 条 路 的 数据 包括 3 个 整数 A、B、C, 表 示 路 口 A 与 路 口 B 之 间 有 一 条 路 ,需要 
C 分 钟 的 时 间 走 过 这 条 路 。 


作为 预习 ,读者 可 以 尝试 用 DFS 做 这 一 题 ,暴力 搜索 出 所 有 可 能 的 路 径 。 在 编程 时 注 
意 用 剪 枝 技术 进行 优化 ,如 果 新 路 径 搜 到 一 半 已 经 比 以 前 得 到 的 最 短路 径 更 长 ,就 停止 搜 这 
个 路 径 , 重 新 开始 搜 下 一 个 。 


10.9.1 Floyd-Warshall 


1. 所 有 点 对 间 的 最 短路 径 

如 何 一 次 性 求 所 有 结 点 之 间 的 最 短 距 离 y Floyd 可 以 完成 这 一 工作 ,其 他 3 种 算法 都 
不 行 。 而 且 Floyd 是 最 简单 的 最 短路 径 算 法 ,程序 比 暴力 的 DFS 更 简单 。 需 要 提醒 的 是 ， 
Floyd 的 复杂 度 很 高 ,只 能 用 于 小 规模 的 图 。 

Floyd 用 到 了 动态 规划 的 思想 : 求 两 点 ij 之 间 的 最 短 距 离 , 可 以 分 两 种 情况 考虑 , 即 
经 过 图 中 某 个 点 & 的 路 径 和 不 经 过 点 & 的 路 径 , 取 两 者 中 的 最 短路 径 。 

动态 规划 的 过 程 可 以 描述 为 : 

(1) 令 &=1, 计 算 所 有 结 点 之 间 ( 经 过 结 点 1\ 不 经 过 结 点 1) 的 最 短路 径 。 

(2) 令 & 一 2, 计 算 所 有 结 点 之 间 ( 经 过 结 点 2、 不 经 过 结 点 2) 的 最 短路 径 , 这 一 次 计算 利 
用 了 &=1 时 的 计算 结果 。 


读者 可 以 这 样 想象 这 个 过 程 : 

(1) 图 上 有 nn 个 结 点 ,m 条 边 。 

(2) 把 图 上 的 每 个 点 看 成 一 个 灯 , 初 始 时 灯 都 是 灭 的 ,大 部 分 结 点 之 间 的 距离 被 初始 化 
为 无 穷 大 INF, 除 了 m 条 边 连 接 的 那些 结 点 以 外 。 

(3) 从 结 点 & 一 1 开始 操作 ,想象 点 亮 了 这 个 灯 , 并 以 二 1 为 中 转 点 ,计算 和 调整 图 上 
所 有 点 之 间 的 最 短 距离 。 很 显然 ,对 这 个 灯 的 邻居 进行 的 计算 是 有 效 的 ,而 对 远离 它 的 那些 
点 的 计算 基本 是 无 效 的 。 

(4) 逐步 点 亮 所 有 的 灯 , 每 次 点 灯 , 就 用 这 个 灯 中 转 ,重新 计算 和 调整 所 有 灯 之 间 的 最 
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短 距 离 ,这 些 计 算 用 到 了 以 前 点 灯 时 得 到 的 计算 结果 。 
(5) 灯 逐 渐 点 亮 , 直 到 图 上 的 点 全 亮 , 计 算 结 束 。 
在 这 个 过 程 中 ,由 于 很 多 计算 是 无 效 的 ,所 以 算法 的 效率 不 高 。 
复杂 度 。 在 下 面 的 程序 中 ,函数 floyd() 有 3 重 循环 ,复杂 度 是 O(2 ) ,只 能 用 于 计算 规 
模 很 小 的 图 , 即 n 二 200 的 情况 。 


hdu 2544 的 Floyd 算法 代码 (邻接 矩阵 ) 


include < bits/stdc++.h> 
using namespace std; 
const int INF = le6; 
const int NUM= 105; 


// 路 口 之 间 的 初始 距离 ,看 成 无 穷 大 ,相当 于 断 开 


int graph[ NUM][ NUM]; // 邻 接 和 矩阵 存 图 
int n, m; 
void floyd() { 

int s=1; // 定 义 起 点 


for(int k=1; k<=n; k++) 
for(int i=1; i<=n; i++) 
if(graph[i][k]! = INF) 
for(int j=1; j<=n; j++) 


//floyd() 的 3 重 循环 


// 一 个 小 优化 ,在 hdu 1704 题 中 很 必要 
// 请 思考 : 把 k 循环 放 到 i、j 之 后 行 不 行 


if(graph[i][j] > graph[i][k] + graph[k][j]) 
graph[i][j] = graph[i][k] + graph[k][j]; 
//graph[i]l[j] = min(graph[i][j], graph[i][k] + graph[k][j]); 
// 上 面 两 句 这 样 写 也 行 ,但 是 min( ) 比 较 慢 ,如 果 图 大 ,可 能 会 超时 .读者 可 以 试 试 poj 3259 
printf(" % d\n", graph[ s][n]); // 输 出 结果 
上} 
int main() { 
while(~scanf("%d%d", gn, gm)) { 
// 如 果 图 的 数据 很 大 ,不 能 用 cin 这 种 慢 的 输入 
if(n==0 && m==0) return 0; 


for(int i=1; i<=n; i++) // 邻 接 矩 阵 初始 化 
for(int j=1; j<=n; j++) 
graph[i][j] = INF; // 任 意 两 点 间 的 初始 距离 为 无 穷 大 


while(m-——){ 
int a; b, ©} 
scanf("%d%d%d", &a, &b, &c); 
graph[a][b] = graph[b][a]l = c; // 邻 接 矩 阵 存 图 
} 
floyd(); 

} 


return 0; 


} 


Floyd 算法 虽然 低 效 , 但 是 也 有 优点 : 

(1) 程序 很 简单 ; 

(2) 可 以 一 次 求 出 所 有 结 点 之 间 的 最 短路 径 ; 

(3) 能 处 理 有 人 负 权 边 的 图 。 

2. 判断 负 

程序 中 有 一 个 有 趣 的 地 方 。 在 程序 中 , 结 点 i 到 自己 的 距离 graph[ 门 [ 门 并 没有 置 初 值 
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为 0, 而 是 INF ,读者 可 能 觉得 很 奇怪 ; 并 且 在 计算 结束 之 后 ,graph[i][ 详 也 不 是 0, 而 是 
graph[ 让 [站 二 graph[ 记 [wj 十 … 十 graph[vj[ 门 , 即 到 外 面 绕 一 圈 回 来 的 最 小 路 径 。 这 一 点 
可 用 于 判断 负 轿 。 

负 圈 是 这 样 产生 的 : 如 果 某 些 边 的 权 值 为 负数 ,那么 图 中 可 能 有 这 样 的 环 路 , 环 路 上 边 
的 权 值 之 和 为 负数 ,这 样 的 环 路 就 是 负 圈 。 每 走 一 次 这 个 负 圈 ,总 权 值 就 会 更 小 ,导致 陷 在 
这 个 圈 里 出 不 来 。 

利用 Floyd 算法 很 容易 判断 负 圈 ,只 要 在 floyd() 中 判断 是 否 存在 某 个 graph[i[i] 二 0 
就 行 了 。 因 为 grapb[ 门 [如是 i 到 外 面 绕 一 圈 回来 的 最 小 路 径 , 如 果 小 于 0, 说 明 存 在 负 圈 。 此 
时 可 置 graph[ 如 [的 初 值 为 0, 这样 能 加 快 判断 过 程 。 请 读者 练习 poj 3259 "Wormholes" 题 。 

3. Floyd 与 邻接 矩阵 

上 面 的 程序 用 邻接 矩阵 存 图 ,实现 Floyd。 邻 接 和 矩阵 十 分 浪费 空间 ,那么 用 邻接 表 是 否 
会 更 好 呢 ? 答案 是 在 Floyd 算法 中 邻接 表 并 不 比邻 接 和 矩阵 好 ,除非 两 点 之 间 有 多 个 边 , 导致 
不 能 用 邻接 矩阵 表示 。 因 为 Floyd 的 计算 过 程 是 用 动态 规划 求 所 有 点 之 间 的 最 短 距 离 , 必 
须 用 一 个 nxn 的 矩阵 记录 状态 ,空间 无 法 节省 。 存 图 的 邻接 矩 阵 可 以 同时 用 来 记录 状态 。 

4. 打印 路 径 

有 时 候 题目 需要 打印 路 径 ,请 读者 练习 hdu 1385 "Minimum Transport Cost"。 如 果 有 
疑问 ,可 以 先 学 习 下 面 的 几 个 算法 ,本 书 都 给 出 了 打印 路 径 的 方法 。 


【习题 】 


hdu 1599“find the mincost route”, 求 最 小 环 。 
hdu 3631“Shortest Path”, Floyd 变形 。 
hdu 1704“rank”, 需 要 在 floyd() 中 加 一 个 优化 : if(graph[i][kj]!=INF)。 


10.9.2 Bellman-Ford 


1.Bellman-Ford 算法 

Bellman-Ford 算法 用 来 解决 单 源 最 短路 径 问 题 : 给 定 一 个 起 点 s, 求 它 到 图 中 所 及 
个 结 点 的 最 短路 径 。 

Bellman-Ford 算法 的 特点 是 只 对 相 邻 结 点 进行 计算 ,可 以 避免 Floyd 那 种 大 撤 网 式 的 
无 效 计算 ,大 大 提高 了 效率 。 为 理解 这 个 算法 ,可 以 想象 图 上 的 每 个 点 都 站 着 一 个 人 ,初始 
时 ,所 有 人 到 * 的 距离 设 为 INF, 即 无 限 大 。 用 下 面 的 步骤 求 最 短路 径 : 

(1) 第 一 轮 , 给 所 有 的 个 人 每 人 一 次 机 会 , 问 他 的 邻居 到 * 的 最 短 距离 是 多 少 ? 如 果 
他 的 邻居 到 * 的 距离 不 是 INF ,他 就 能 借 道 这 个 邻居 到 s 去 ,并 且 把 自己 原来 的 INF 更 新 为 
较 短 的 距离 。 显 然 ,开始 的 时 候 , 起 点 s 的 直 连 邻居 (例如 wx) 肯定 能 更 新 距离 ,而 的 邻居 
(例如 wv) ,如 果 在 更 新 之 后 问 v, 那 么 v 有 机 会 更 新 ,否则 就 只 能 保持 INF 不 变 。 特 别 地 ， 
在 第 一 轮 更 新 中 ,存在 一 个 与 最近 的 邻居 t,t 到 ;s 的 直 连 距离 就 是 全 图 中 上 到; 的 最 短 距 


@ Bellman-Ford 的 历史 与 改进 : https://en. wikipedia. org/ wiki/ Bellman-Ford_algorithm( 短 网 址 : t cn/RSrredV) 。 
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离 。 因 为 它 通 过 别 的 邻居 绕 路 到 ,肯定 更 远 。 nie 经 得 到 ,后 面 不 会 再 更 新 。 
在 很 多 教材 中 把 一 轮 更 新 称 为 一 次 “松弛 (relax)”, 这 个 概念 也 用 在 Dijkstra 算法 中 。 

(2) 第 二 轮 ,重复 第 一 轮 的 操作 ,再 给 每 个 人 一 eg 这 一 轮 操作 之 后 ,至 
少 存在 一 个 ;或 1 的 邻居 wv, 可 以 算出 它 到 * 的 最 短 距离 。wv 要 么 与 ; 直 连 ,要 么 是 通过 +t 到 
达 s 的 。wv 的 最 短 距离 也 得 到 了 ,后面 不 会 再 更 新 。 

(3) 第 三 轮 , 再 给 每 个 人 一 次 机 会 …… 

继续 以 上 操作 ,直到 所 有 人 都 不 能 再 更 新 最 短 距离 为 止 。 

一 共 需 要 几 轮 操作 呢 ? 每 一 轮 操 作 都 至 少 有 一 个 新 的 结 点 得 到 了 到 * 的 最 短路 径 。 所 


以 ,最 多 只 需要 n 轮 操作 就 能 完成 n 个 结 点 。 在 每 一 轮 操 作 中 ,需要 检查 所 有 m 个 边 ,更 新 
最 短 距 离 。 根 据 以 上 分 析 ,Bellman-Ford 算法 的 复杂 度 是 O(nm)。 
以 上 过 程 ,每 个 结 点 可 以 独立 进行 计算 ,所 以 这 个 算法 符合 并 行 计 算 的 思想 ,可 以 用 在 


并 行 计算 上 。 例 如 计算 机 网 络 的 BGP 路 由 协议 ,每 个 路 由 器 是 一 个 结 点 , 它 根据 与 邻居 的 
信息 交换 ,独自 计算 到 网 络 中 其 他 路 由 器 的 最 短 距离 。BGP 是 Bellman-Ford 算法 (更 准确 
地 说 ,是 下 面 的 SPFA 算法 ) 的 一 个 典型 应 用 。 

Bellman-Ford 有 现实 的 模型 , 即 问 路 。 每 个 十 字 路 口 站 着 一 个 警察 ; 在 
某 个 路 口 ,路 人 问 一 个 警察 ,怎么 走 到 s 最 近 ? 如 果 这 个 警察 不 知道 ,他 会 问 
相 邻 几 个 路 口 的 警察 :“ 从 你 这 个 路 品 走 ,能 到 ， 吗 ? 有 多 远 ?" 这 些 警察 可 能 i 
也 不 知道 ,他 们 会 继续 问 新 的 邻居 。 这 样 传递 下 去 ,最 后 肯定 有 个 警察 是 ; 路 ” 国 虹 哎 尖 
口 的 警察 ,他 会 把 * 的 信息 返回 给 他 的 邻居 ,邻居 再 返回 给 邻 届 。 最 后 所 有 的 。 视频 讲解 
警察 都 知道 怎么 走 到 ;, 而 且 是 最 短 的 路 : 从 * 返回 信息 到 所 有 其 他 点 的 过 程 就 像 在 一 个 平 
静 的 池塘 中 从 丢 下 一 个 石头 , 荡 起 的 涟 游 一 圈 圈 向 外 扩散 ,这 一 圈 圈 泛 满 妈 和 
是 最 短 的 。 

问 路 模型 里 有 趣 的 一 点 ,并 且 能 体现 Bellman-Ford 思想 的 是 警察 并 不 需要 知道 到 ;的 
完整 的 路 径 , 他 只 需要 知道 从 自己 的 路 口 出 发 往 哪 个 方向 走 能 到 达 ,并 且 路 最 近 。 

下 面 是 hdu 2544 的 Bellman-Ford 程序 ,用 bellman() 替 换 上 一 节 的 floyd(C) 即 可 。 


hdu 2544 的 Bellman-Ford 算法 代码 (邻接 矩阵 ) 


void bellman(){ 


int s=1; // 定 义 起 点 
int d[ NUM]; //d[i] 记 录 结 点 i 到 起 点 s 的 最 短 距离 .本 题 s= 1 
for(int i=1; i<=n; i++) 
d[i] = INE; // 所 有 结 点 到 s 的 距离 初始 化 为 无 穷 大 
d[s] = 0; // 以 上 是 初始 化 d[ ] 
for(int k=1; k<=n; k++) //n 轮 操作 


for(int i=1; i<=n; i++) 
//i 和 j: 处 理 图 中 存在 的 边 , 即 graph[i][j] 不 等 于 INF 的 边 
for(int j=1; j<=n; j++) 
if(d[j] > d[i] + graph[i][j]) 
//j 通过 i 到 达 起 点 s: 如 果 距 离 更 短 , 更 新 
d[j] = d[i] + graph[i][j]; 
printf("% d\n",d[n]); // 输 出 结果 
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但 是 上 面 的 代码 并 没有 实用 价值 。 由 于 使 用 了 邻接 矩阵 这 种 不 合适 的 数据 结构 , 它 没 
有 发 挥 出 Bellman-Ford 的 威力 。Bellman-Ford 的 每 一 轮 操作 只 需要 检查 存在 的 m 条 边 。 
在 nXn 的 邻接 矩阵 中 ,这 m 条 边 是 那些 不 等 于 INF 的 边 ,但 是 上 面 的 程序 却 不 得 不 检查 所 
有 nxXxn 条 边 。 

下 面 的 程序 对 存储 进行 了 优化 ,用 struct edge e[L10005] 数 组 来 存 m 条 边 ,避免 了 存储 
那些 不 存在 的 边 。 这 种 简单 的 存储 方法 不 是 邻接 表 ,不 能 快速 搜 一 个 结 点 的 所 有 邻居 ,不 过 
正 适合 Bellman-Ford 这 种 简单 的 算法 。 


hdu 2544 的 Bellman-Ford 算法 代码 (数组 存 边 ) 


include < bits/stdc++.h> 
using namespace std; 
const int INF = le6; 
const int NUM = 105; 
struct edge { int u, v, w; } e[10005]; // 边 : 起 点 uv, 终点 v, 权 值 w 
int n, m, cnt; 
int pre[ NUM]; 
// 记 录 前 驱 结 点 .pre[x] = y, 在 最 短路 径 上 , 结 点 x 的 前 一 个 结 点 是 y 


void print path(int s, int t) { // 打 印 从 s 到 上 的 最 短路 径 
if(s==t){ printf("%d"，s); return; } // 打 印 起 点 
print_path(s, pre[t]); // 先 打印 前 一 个 点 
printf(" %d", t); // 后 打印 当前 点 .最 后 打印 的 是 终点 t 
} 
void bellman( ){ 
int s=1; // 定 义 起 点 
int d[ NUM]; //d[i 记 记录 第 i 个 结 点 到 起 点 s 的 最 短 距离 
for (int i=1; i<=n; i++) d[i] = INF; // 初 始 化 为 无 穷 大 
d[s]=0; 
for (int k=1; k<=n; k++) // 一 共有 n 轮 操 作 
for (int i=0; i<cnt; i++){ // 检 查 每 条 边 


int x = e[il.u y= elil.v; 
if (d[x] > d[y] + e[i].w){ 
//x 通 过 Y 到 达 起 点 s: 如 果 距 离 更 短 ,更 新 
d[x]= d[y] + e[i].w; 
pre[lx] = y; // 如 果 有 需要 ,记录 路 径 
} 
} 
printf(" % d\n", d[n]); 
//print_path(s,n); // 如 果 有 需要 ,打印 路 径 
} 
int main() { 
while(~scanf(" %d%d", gn, gm)) { 
if(n==0 && m== 0) return 0; 


cnt = 0; // 记 录 边 的 数量 . 本题 的 边 是 双向 的 ,共有 2m 条 
while (m-——){ 
int a,b,c; 


scanf("%d%ds%d",&a,&b,&c); 
e[lcnt].u=a; e[cnt].v=b; elcnt].w=c; cnt++; 
e[cnt].u=b; elcnt].v=a; el[cnt].w=c; cnt++; 
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} 

bellman( ); 
} 
return 0; 


} 


2. 打印 最 短路 径 


计算 出 最 短 距离 后 ,如 果 要 打印 整个 路 径 , 十 分 容易 。 


对 于 单 源 最 短路 径 算法 Bellman-Ford( 以 及 后 面 讲 到 的 Dijkstra) ,在 连通 图 中 ,从 起 点 
s 到 任意 一 个 结 点 t 都 有 一 条 最 短路 径 ( 如 果 有 多 条 最 短路 径 , 就 简单 地 选 其 中 一 条 ,其 他 的 
丢弃 ); 反 过 来 看 ,从 任意 一 个 结 点 往 前 追溯 , 沿 着 最 短路 径 , 一 个 结 点 一 个 结 点 往 回 走 ， 


就 能 到 达 起 点 *。 所 以 ,只 要 在 每 个 结 点 上 记录 它 的 前 驱 结 点 就 行 了 。 


定义 pre[L] 记 录 前 驱 结 点 。preLzj]=y 的 意思 是 在 最 短路 径 上 结 点 x 的 前 一 个 结 点 是 


y。 然 后 用 print_path() 打 印 整 个 路 径 。 
3. 判断 负 轿 


Bellman-Ford 也 能 判断 负 圈 。 当 没有 负 圈 时 ,只 需要 轮 就 结束 。 如 果 超过 轮 ,最 短 


路 径 还 有 变化 ,那么 肯定 有 人 负 圈 。 


判断 负 圈 的 程序 可 以 写 在 两 个 for 循环 结束 后 。 检查 所 有 的 边 , 如果 存 在 某 个 边 
Cu,u), 有 do 二 du 十 zw(usu) ,说 明 d(w) 的 更 新 未 结束 ,还 能 更 新 为 更 小 的 值 。 这 只 能 


是 负 圈 引起 的 。 


更 紧凑 的 程序 可 以 这 样 写 : 在 循环 内 部 判断 是 不 是 超过 了 n 轮 。 程 序 如 下 : 
hdu 2544 的 Bellman-Ford 算法 代码 (有 判断 负 圈 的 功能 ) 


void bellman(){ 
int d[ NUM]; 
for (int i=2;i<=n;it+) 
d[i] = INF; 
d[1]=0; 
intk = 0; 
bool update = true; 
while(update) { 
k++; 
update = false; 
if(k > n) {printf(" 有 负 轿 "); return;} 
for (int i=0; i<cnt; i++){ 
int x = e[il]l.u, y = e[i].v; 
if (d[x] > d[y] + eli].w){ 
update = true; 
d[x] = d[y] + eli].w; 
} 
} 
1 
printf(" % d\n",d[n]); 


// 记 录 有 几 轮 操作 
// 判 断 是 否 有 更 新 


// 有 负 转 ,停止 
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10.9.3 SPFA 


用 队列 处 理 Bellman-Ford 算法 可 以 很 好 地 优化 ,这 种 方法 叫 作 SPFA。SPFA 的 效率 
很 高 ,在 算法 竞赛 中 的 应 用 很 广泛 。 

Bellman-Ford 算法 有 很 多 低 效 或 无 效 的 操作 。 分 析 Bellman-Ford 算法 ,其 核心 部 分 是 
在 每 一 轮 操 作 中 更 新 所 有 结 点 到 起 点 * 的 最 短 距离 。 根 据 前 面 的 讨论 可 知 ,计算 和 调整 一 
个 结 点 到 s 的 最 短 距 离 后 ,如 果 紧 接着 调整 v 的 邻居 结 点 ,这 些 邻 居 肯 定 有 新 的 计算 结 
果 ; 而 如 果 漫 无 目的 地 计算 不 与 相 邻 的 结 点 ,很 可 能 毫 无 变化 ,所 以 这 些 操 作 是 低 效 的 。 

因此 ,在 计算 结 点 之 后 ,下 一 步 只 计算 和 调整 它 的 邻居 ,这 样 能 加 快 收敛 的 过 程 。 这 
些 步骤 可 以 用 队列 进行 操作 ,这 就 是 SPFA。 

SPFA 很 像 BFS: 

(1) 起 点 * 和 人 队 ,计算 它 所 有 邻居 到 * 的 最 短 距离 (当前 最 短 距离 ,不 是 全 局 最 短 距 离 。 
在 下 文中 ,把 计算 一 个 结 点 到 起 点 * 的 最 短路 径 简称 为 更 新 状态 。 最 后 的 “状态 ”就 是 
SPFA 的 计算 结果 )。 把 * 出 队 , 状 态 有 更 新 的 邻居 入 队 , 没 更 新 的 不 和 人 队 。 也 就 是 说 ,队列 
中 都 是 状态 有 变化 的 结 点 ,只 有 这 些 结 点 才 会 影响 最 短路 径 的 计算 。 

(2) 现在 队列 的 头 部 是 ; 的 一 个 邻居 ww。 弹出 ,更 新 其 所 有 邻居 的 状态 ,把 其 中 有 状 
态 变化 的 邻居 入 队列 。 

(3) 这 里 有 一 个 问题 ,弹出 x 之 后 ,在 后 面 的 计算 中 x 可 能 会 再 次 更 新 状态 (后 来 发 现 ， 
& 借 道 其 他 结 点 去 ; ,路 更 近 )。 所 以 ,x 可 能 需要 重新 人 队列 。 这 一 点 很 容易 做 到 : 在 处 理 
一 个 新 的 结 点 时 , 它 的 邻居 可 能 就 是 以 前 处 理 过 的 wx, 如 果 的 状态 变化 了 ,把 重新 加 
入 队列 就 行 了 。 

(4) 继续 以 上 过 程 , 直 到 队列 空 。 这 也 意味 着 所 有 结 点 的 状态 都 不 再 更 新 。 最 后 的 状 
态 就 是 到 起 点 * 的 最 短路 径 。 

上 面 第 (3) 点 决定 了 SPFA 的 效率 。 有 可 能 只 有 很 少 结 点 重新 进入 队列 ,也 有 可 能 很 
多 。 这 取决 于 图 的 特征 ,即使 两 个 图 的 结 点 和 边 的 数量 一 样 ,但 是 边 的 权 值 不 同 ,它们 的 
SPFA 队列 也 可 能 差别 很 大 。 所 以 ,SPFA 是 不 稳定 的 。 

在 比赛 时 ,有 的 题目 可 能 故意 卡 SPFA 的 不 稳定 性 : 如 果 一 个 题目 的 规模 很 大 ,并 且 边 
的 权 值 为 非 负 数 , 它 很 可 能 故意 设置 了 不 利于 SPFA 的 测试 数据 。 此 时 不 能 冒险 用 SPFA， 
而 是 用 下 一 节 的 Dijkstra 算法 。Dijkstra 是 一 种 稳定 的 算法 ,一 次 迭代 至 少 能 找到 一 个 结 
点 到 ; 的 最 短路 径 , 最 多 只 需要 m( 边 数 ) 次 迭代 即 可 完成 。 

1. 基于 邻接 表 的 SPFA 

在 这 个 程序 中 , 存 图 最 合适 的 方法 是 邻接 表 。 上 面 第 (2) 步 是 更 新 的 所 有 邻居 结 点 的 
状态 ,而 邻接 表 可 以 很 快 地 检索 一 个 结 点 的 所 有 邻居 , 正 符合 算法 的 需要 。 程 序 main() 输 
入 图 时 ,每 执行 一 次 e[aj. push_back (edge(a,b,c)), 就 把 边 (a,5) 存 到 了 结 点 a 的 邻接 表 
中 ; 在 spfa() 中 ,执行 for(int i 二 0; i 过 e[uj. size(); i 十 十 ) ,就 检索 了 结 点 w 的 所 有 邻居 。 


hdu 2544 的 SPFA 算法 代码 (邻接 表 十 队列 ) 


include < bits/stdc++.h> 
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using namespace std; 

const int INF = le6; 

const int NUM = 105; 

struct edge{ 
int from, to, w; 

// 边 : 起 点 from, 终点 to, 权 值 w. from 并 没有 用 到 , e[i] 的 i 就 是 from 
edge(int a, int b, int c){from=a; to=b; w=c;} 

撤 

vector < edge > e[ NUM]; //e[i]: 存 第 i 个 结 点 连接 的 所 有 边 

int n, m; 

int pre[ NUM]; 

// 记 录 前 驱 结 点 .pre[x] = y, 在 最 短路 径 上 , 结 点 x 的 前 一 个 结 点 是 y 


void print_path(int s, int t) { // 打 印 从 s 到 上 的 最 短路 径 
5 // 内 容 与 Bellman - Ford 程序 中 的 print_path( ) 完 全 一 样 
} 
int spfa(int s){ 
int dis[NUM]; // 记 录 所 有 结 点 到 起 点 的 距离 
bool ing[NUM]; /Vinq[i] = true 表示 结 点 i 在 队列 中 
int Neg[ NUM]; // 判 断 负 圈 (Negative loop) 
memset(Neg, 0, sizeof(Neg)); 
Neg[s] = 1; 
for(int i=1;i<=n;it+) { dis[i] =INF; inq[i]=false; } // 初 始 化 
dis[s] = 0; // 起 点 到 自己 的 距离 是 0 
queue< int > Q; 
Q. push( s); 
inq[s] = true; // 起 点 进 队 列 


while(!Q.empty()) { 
intu = Q.front(); 
Q. pop(); // 队 头 出 队 
inq[u] = false; 
for(int i=0; i<e[lu].size(); i++) { // 检 查 结 点 u 的 所 有 邻居 
intv = e[ul[il.to w = e[u]l[i].w; 
if (dis[u] tw<dis[v]) { 
/ 作 的 第 个 邻居 v, 它 借 道 ,到 s 更 近 
dis[v] = dis[u] +w; // 更 新 第 并 个 邻居 到 s 的 距离 
pre[v] = u; // 如 果 有 需要 ,记录 路 径 
if(!ing[v]) { 
// 第 并 个 邻居 更 新 状态 了 ,但 是 它 不 在 队列 中 ,把 它 放 进 队列 


inq[v] = true; 


Q. push(v); 
Neg[v]++; 
if(Neg[v] > n) return 1; // 出 现 负 图 
} 
} 
} 
} 
printf("% d\n",dis[n]); 
//print_path(s, n); // 如 果 有 需要 ,打印 路 径 
return 0; 
} 
int main(){ 
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while(~scanf("%d%d",gn, gm)) { 


if(n==0 && m== 0) return 0; 
for(int i=1; i<=n; it+)  e[i].clear(); 
while(m-——){ 

int a,b,c; 


scanf("%d%d%d", &a, &b, &c); 
e[al]. push_ back(edge(a,b, c)); 
// 结 点 a 的 邻居 ,都 放 在 node[a] 里 
e[b]. push back(edge(b,a, c)); 
} 
spfa(1); // 起 点 是 1 
} 
return 0; 


} 


前 面 在 讲 Bellman-Ford 的 时 候 , 曾 提 到 它 适合 并 行 计算 。 读 者 可 以 发 现 , SPFA 比 
Bellman-Ford 能 更 有 效率 地 进行 并 行 计算 。 例 如 前 面 提 到 的 问 路 的 例子 ,每 个 警察 只 需要 
在 某 个 邻居 警察 通知 有 路 径 变 化 之 后 才 进 行 计算 ,并 把 变化 传递 给 别 的 邻居 ; 如 果 没 有 收 
到 邻居 发 来 的 变化 信息 ,警察 不 需要 做 任何 动作 。 这 正 是 SPFA 的 思想 。 

判断 负 圈 。SPFA 也 适用 于 有 负 权 值 的 图 ,也 能 判断 负 圈 。 如 果 有 一 个 点 进 队 列 超过 
n 次, 那 就 说 明 图 中 存在 负 圈 。 具 体 见 程序 中 与 Neg[ ] 有 关 的 部 分 。 

打印 最 短路 径 。 和 前 面 Bellman-Ford 打印 最 短路 径 非 常 相似 。 定 义 pre[ 记录 前 驱 结 
点 ,然后 用 print_path() 打 印 整个 路 径 。 具 体内 容 见 程序 。 

2. 基于 链 式 前 向 星 的 SPFA 

上 面 的 基于 邻接 表 的 代码 已 经 很 好 了 ,不 过 ,在 极端 的 情况 下 ,图 特别 大 ,用 邻接 表 也 会 
超 空 间 限制 ,此 时 就 需要 用 到 前 面 提 到 的 链 式 前 向 星 来 存 图 。 

建议 读者 认真 消化 下 面 的 代码 ,内 容 包括 链 式 前 向 星 存 图 .SPFA 算法 、 打 印 最 短 距离 、 
打印 路 径 、 判 断 负 圈 。 这 是 本 书 精心 整理 的 一 套 模 板 。 

读者 可 以 套用 这 个 模板 , 试 试 hdu 1535 "Invitation Cards" 题 。hdu 1535 题 的 图 有 100 
万 个 点 ,如 果 不 用 链 式 前 向 星 , 用 别 的 数据 结构 很 容易 发 生 MLE 错误 。 


hdu 2544 的 SPFA 算法 代码 ( 链 式 前 向 星 ) 


include <bits/stdc++.h> 
using namespace std; 
const int INF = INT MAX / 10; 


const int NUM = 1000005; // 一 百 万 个 点 ,一 百 万 个 边 

struct Edge{ // 边 : edge[i] 的 i 就 是 起 点 ,终点 to, 权 值 w. 下 一 个 边 next 
int to, next, w; 

J}edge[ NUM]; 


int n, m, cnt; 
int head[ NUM]; 


int dis[NUM]; // 记 录 所 有 结 点 到 起 点 的 距离 

bool inq[ NUM]; //ing[i] = true 表示 结 点 i 在 队列 中 
int Neg[ NUM]; // 判 断 负 园 (Negative loop) 

int pre[ NUM]; // 记 录 前 驱 结 点 
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void print_path(int s, intt) { // 打 印 从 s 到 + 的 最 短路 径 


; // 内 容 与 Bellman -Ford 程序 中 的 print_path() 完 全 一 样 


void in 让 (){ 


for(int i = 0; i< NOM; ++i){ 


edge[i].next = —1; 
head[i] = -1; 

. 

cnt = 0; 


void addedge(int u int v int w){ // 前 向 星 存 图 


edge[ cnt].to = v; 
edge[cnt].w = w; 
edge[ cnt].next = head[u]; 
head[u] = cnt++; 


int spfa(int s) { 


memset (Neg, 0, sizeof(Neg)); 


Neg[s] = 1; 
for(int i=1; i<=n; i++) { dis[i] = INF; inq[i] = false; }// 初 始 化 
dis[s] = 0; // 起 点 到 自己 的 距离 是 0 
queue < int > Q; 
Q. push( s); 
inq[s] = true; // 起 点 进 队 列 
while(!Q. empty()) { 
intu = 0.front(); Q.pop(); // 队 头 出 队 
inq[u] = false; 
for(int i= head[u]; ~i; i = edge[i].next) { //~i 也 可 以 写成 il= -1 


intv = edge[il].to, w = edge[i].w; 
if (dis[u] +w< dis[v]) { 
//u 的 第 个 邻居 v, 它 借 道 u 到 s 更 近 
dis[v] = dis[u] +w; // 更 新 第 i 个 邻居 到 s 的 距离 
pre[v] = u; // 如 果 有 需要 ,记录 路 径 
if(!ing[v]) { 
// 邻 居 v 更 新 状态 了 ,但 是 它 不 在 队列 中 ,把 它 放 进 队列 


inq[v] = true; 


Q. push(v); 
Neg[v]++; 
if(Neg[v] > n) return 1; // 出 现 负 转 
} 
} 
} 
} 
printf(" % d\n", dis[n]); // 从 s 到 n 的 最 短 距离 
//print_path(s, n); // 如 果 有 需要 ,打印 路 径 
return 0; 
} 
int main() { 


while(~scanf("%d%d",gn,gm)) { 
init(); 
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if(n==0 && m== 0) return 0; 
while(m-—){ 
int u,vV,w; 
scanf("%d%d$%d", &u, &v, &w); 
addedge( u,v,w); 
addedge(v, u,w); 
} 
spfa(1); 
J: 


return 0; 


10.9.4 Dijkstra 


Dijkstra 算法 也 用 来 解决 单 源 最 短路 径 问 题 。Dijkstra 是 非常 高 效 而 且 稳 定 的 算法 , 它 
比 前面 提 到 的 最 短路 径 算法 都 复杂 一 些 , 下 面 先 介绍 它 的 思想 。 

前 面 在 讲 Bellman-Ford 算法 时 , 提 到 它 在 现实 中 的 模型 是 找 警 察 问 路 。 在 现实 中 ， 
Dijkstra 有 另外 的 模型 ,例如 多 米 诺 骨 有 牌 ,读者 可 以 想象 下 面 的 场景 。 

在 图 中 所 有 的 边 上 排 满 多 米 诺 骨 牌 ,相当 于 把 骨牌 看 成 图 的 边 。 一 条 边 上 的 多 米 诺 骨 
牌 数 量 和 边 的 权 值 (例如 长 度 或 费用 ) 成 正比 。 规 定 所 有 上 骨牌 倒 下 的 速度 都 是 一 样 的 。 如 果 
在 一 个 结 点 上 推倒 骨牌 ,会 导致 这 个 结 点 上 的 所 有 骨牌 都 往 后 面倒 下 去 。 

在 起 点 * 推倒 骨牌 ,可 以 观察 到 ,从 * 开始 , 它 连接 的 边 上 的 骨牌 都 逐渐 倒 下 ,并 到 达 所 
有 能 达到 的 结 点 。 在 某 个 结 点 上 ,可 能 先后 从 不 同 的 线路 倒 骨牌 过 来 ; 先 倒 过 来 的 骨牌 ,其 
经 过 的 路 径 肯定 就 是 从 s 到达: 的 最 短路 径 ; 后 倒 过 来 的 骨牌 ,对 确定 结 点 上 的 最 短路 径 没 
有 贡献 ,不 用 管 它 。 

从 整体 看 ,这 就 是 一 个 从 起 点 * 扩散 到 整个 图 的 过 程 。 

在 这 个 过 程 中 ,观察 所 有 结 点 的 最 短路 径 是 这 样 得 到 的 : 

(1) 在 ;的 所 有 直 连 邻居 中 ,最 近 的 邻居 ,骨牌 首先 到 达 。w 是 第 一 个 确定 最 短路 径 
的 结 点 。 从 uw 直 连 到 的 路 径 肯 定 是 最 短 的 ,因为 如 果 绕道 别 的 结 点 到 ; ,必然 更 远 。 

(2) 然后 ,把 后 面 骨牌 的 倒 下 分 成 两 个 部 分 ,一 部 分 是 从 * 继续 倒 下 到 的 其 他 的 直 连 
邻居 , 另 一 部 分 是 从 xz 出 发 倒 下 到 x 的 直 连 邻居 。 那 么 下 一 个 到 达 的 结 点 v 必然 是 s 或 者 & 
的 一 个 直 连 邻居 。w 是 第 二 个 确定 最 短路 径 的 结 点 。 

(3) 继续 以 上 步骤 ,在 每 一 次 迭代 过 程 中 都 能 确定 一 个 结 点 的 最 短路 径 。 

Dijkstra 算法 应 用 了 贪心 法 的 思想 , 即 “ 抄 近 路 走 , 肯 定 能 找到 最 短路 径 ”。 

在 上 述 步骤 中 可 以 发 现 : Dijkstra 的 每 次 迭代 ,只 需要 检查 上 次 已 经 确定 最 短路 径 的 那 
些 结 点 的 邻居 ,检查 范围 很 小 ,算法 是 高 效 的 ; 每 次 迭代 ,都 能 得 到 至 少 一 个 结 点 的 最 短路 
径 , 算 法 是 稳定 的 。 

与 Bellman-Ford 对 比 : Bellman-Ford 是 分 布 式 的 思想 ; 而 Dijkstra 必须 从 起 点 s 开始 
扩散 和 计算 ,是 集中 式 的 思想 。 读 者 可 以 试 试 在 多 米 诺 骨 牌 模型 中 运用 Bellman-Ford ,看 
看 行 不 行 。 

那么 如 何 编程 实现 呢 ? 程序 的 主要 内 容 是 维护 两 个 集合 , 即 已 确定 最 短路 径 的 结 点 集 
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合 A .这些 结 点 向 外 扩散 的 邻居 结 点 集合 B。 程 序 逻 辑 如 下 : 

(1) 把 起 点 s 放 到 A 中 ,把 s 所 有 的 邻居 放 到 B 中 。 此 时 ,邻居 到 * 的 距离 就 是 直 连 
距离 。 

(2) 从 B 中 找 出 距离 起 点 s 最 短 的 结 点 4, 放 到 A 中 。 

(3) 把 w 所 有 的 新 邻居 放 到 B 中 。 显 然 ,u 的 每 一 条 边 都 连接 了 一 个 邻居 ,每 个 新 邻居 
都 要 加 进去 。 其 中 x 的 一 个 新 邻居 wv, 它 到 s 的 距离 dis(s,v) 等 于 dis(s,w) 十 dis(w,v)。 

(4) 重复 (2)、(3) ,直到 B 为 空 时 结束 。 

计算 结束 后 ,可 以 得 到 从 起 点 * 到 其 他 所 有 点 的 最 短 距离 。 

下 面 举例 说 明 , 如 图 10. 24 所 示 。 

在 图 10. 24 中 ,起 点 是 1, 求 1 到 其 他 所 有 结 点 的 最 短路 径 。 

(1) 1 到 自己 的 距离 最 短 ,把 1 放 到 集合 A 里 : A={1}。 把 1 的 邻 
居 放 到 集合 B 里 : B=={(2 一 5),(3 一 2)}。 其 中 (2 一 5) 表 示 结 点 2 到 起 
点 的 距离 是 5。 

(2) 从 B 中 找到 离 集合 A 最 近 的 结 点 ,是 结 点 3。 在 A 中 加 上 3, 现 
在 A={1,3), 也 就 是 说 得 到 了 从 1 到 3 的 最 短 距离 ; 从 B 中 拿 走 (3 一 2) ,现在 B=={(2 一 5)}。 

(3) 对 结 点 3 的 每 条 边 ,扩展 它 的 新 邻居 , 放 到 B 中 。3 的 新 邻居 是 2 和 4, 那么 B= 
{(2 一 5),(2 一 4),(4 一 7)}。 其 中 (2 一 4) 是 指 新 邻居 2 通过 3 到 起 点 1, 距 离 是 4。 由 于 (2 一 4) 
比 (2 一 5) 更 好 ,丢弃 (2 一 5),B=={(2 一 4), (4 一 7)})。 

(4) 重复 步骤 (2)、(3)。 从 B 中 找到 离 起 点 最 近 的 结 点 ,是 结 点 2。 在 A 中 加 上 2, 并 从 
B 中 拿 走 (2 一 4); 扩展 2 的 邻居 放 到 B 中 。 现 在 A={1,3,2)},B 一 {(4 一 7),(4 一 5)}。 由 于 
(4 一 5) 比 (4 一 7) 更 好 ,丢弃 (4 一 7),B 二 {(4 一 5)}。 

(5) 从 B 中 找到 离 起 点 最 近 的 结 点 ,是 结 点 4。 在 A 中 加 上 4, 并 从 B 中 拿 走 (4 一 5)。 
此 时 已 经 没有 新 邻居 可 以 扩展 。 现 在 A 二 {1,3,2,4},B 为 空 , 结 束 。 

下 面 讨 论 上 述 步骤 的 复杂 度 。 图 的 边 共 有 m 个 ,需要 往 集合 B 中 扩展 m 次 。 在 每 次 
扩展 后 ,需要 找 集合 B 中 距离 起 点 最 小 的 结 点 。 集 合 B 最 多 可 能 有 个 结 点 。 把 问题 抽象 
为 每 次 往 集 合 B 中 放 一 个 数据 ,在 B 中 的 n 个 数 中 找 最 小 值 ,如 何 快速 完成 ? 如 果 往 B 中 
放 数 据 是 乱 放 , 找 最 小 值 也 是 用 类 似 冒 泡 的 简单 方法 ,复杂 度 是 nn, 那么 总 复杂 度 是 OCrm)， 
和 Bellman-Ford 一 样 。 

上 述 方法 可 以 改进 ,得 到 更 好 的 复杂 度 。 改 进 的 方法 如 下 : 

(1) 每 次 往 B 中 放 新 数据 时 按 从 小 到 大 的 顺序 放 , 用 二 分 法 的 思路 ,复杂 度 是 
O(logzn) ,保证 最 小 的 数 总 在 最 前 面 。 

(2) 找 最 小 值 ,直接 取 B 的 第 一 个 数 ,复杂 度 是 0(1)。 

此 时 Dijkstra 算法 总 的 复杂 度 是 O(mlogsn) ,是 最 高 效 的 最 短路 径 算法 。 

在 编程 时 ,一 般 不 用 自己 写 上 面 的 程序 ,直接 用 STL 的 优先 队列 就 行 了 ,完成 数据 的 插 
入 和 提取 。 

下 面 的 程序 代码 中 有 两 个 关键 技术 : 

(1) 用 邻接 表 存 图 和 查找 邻居 。 对 邻居 的 查找 和 扩展 是 通过 动态 数组 vector < edge > 
eLNUMD 实 现 的 邻接 表 , 和 上 一 节 的 SPFA 一 样 。 其 中 e[ 门 存储 第 i 个 结 点 上 所 有 的 边 , 边 
的 一 头 是 它 的 邻居 , 即 struct edge 的 参数 to。 在 需要 扩展 结 点 i 的 邻居 的 时 候 ,查找 e[ 门 即 可 。 
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图 10.24 无 向 图 
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已 经 放 到 集合 A 中 的 结 点 不 要 扩展 ; 程序 中 用 bool doneLNUMD 记 录 集 合 A, 当 done[ 可 =true 
时 ,表示 它 在 集合 A 中 ,已 经 找到 了 最 短路 径 。 

(2) 在 集合 B 中 找 距离 起 点 最 短 的 结 点 。 直 接 用 STL 的 优先 队列 实现 ,在 程序 中 是 
priority_queue < s_node > Q。 但 是 有 关 丢 弃 的 动作 ,STL 的 优先 队列 无 法 做 到 。 例 如 步骤 
(3) 中 ,需要 在 B= 二 {(2 一 5),(2 一 4),(4 一 7)} 中 丢弃 (2 一 5) ,但 是 STL 没有 这 种 操作 。 在 程序 
中 也 是 用 bool doneLNUMD 协 助 解决 这 个 问题 。 从 优先 队列 pop 出 (2 一 4) 时 ,记录 done[2]= 
true, 表 示 结 点 2 已 经 处 理 好 。 下 次 从 优先 队列 pop 出 (2 一 5) 时 ,判断 done[2] 是 true， 
丢弃 。 

下 面 是 模板 代码 。 

hdu 2544 的 Dijkstra 算法 代码 (邻接 表 十 优先 队列 ) 


include < bits/stdc++.h> 

using namespace std; 

const int INF = le6; 

const int NUM = 105; 

struct edge{ 
int from, to, w; 

// 边 : 起 点 ,终点 , 权 值 .起 点 from 并 没有 用 到 , e[i] 的 i 就 是 from 
edge(int a, int b, int c){from=a; to=b; w=c;} 

}; 


vector < edge > e[ NUM]; // 用 于 存储 图 
struct s_node{ 
int id, n_dis; //id: 结 点 ; n_dis: 这 个 结 点 到 起 点 的 距离 


s_node(int b, int c){id=b; n dis=c;} 
bool operator < (const s_node & a) const 
{ returnn dis>a.n dis;} 


}; 


int n,m; 
int pre[ NUM]; // 记 录 前 驱 结 点 
void print_path(int s,int t) { // 打 印 从 s 到 + 的 最 短路 径 
人 // 内 容 与 Bellman - Ford 程序 中 的 print_path( ) 完 全 一 样 
} 
void dijkstra( ){ 
ints = 1; // 起 点 s 是 1 
int dis[NUM]; // 记 录 所 有 结 点 到 起 点 的 距离 
bool done[ NUM]; //done[i] = true 表示 到 结 点 i 的 最 短路 径 已 经 找到 
for (int i=1;i<=n;it+) {dis[i] = INF; done[i] = false; } // 初 始 化 
dis[s]=0; // 起 点 到 自己 的 距离 是 0 


priority queue < s_node> Q; // 优 先 队列 , 存 结 点 信息 
Q.push(s_node(s, dis[s])); // 起 点 进 队 列 
while (!Q.empty() { 

s_node u = Q.top(); //pop 出 距 起 点 s 距离 最 小 的 结 点 u 

Q. pop(); 

if(done[u. id]) 

// 丢 弃 已 经 找到 最 短路 径 的 结 点 , 即 集合 A 中 的 结 点 
continue; 
done[u.id] = true; 
for (int i=0; i<e[u.id].size(); it++) {  // 检 查 结 点 u 的 所 有 邻居 
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edgey = e[u.id][i]; //u.id 的 第 i 个 邻居 是 y. to 
if(done[y. to]) // 丢 弃 已 经 找到 最 短路 径 的 邻居 结 点 
continue; 


if (dis[y.to] >y.w + u.n dis) { 
dis[y.to] = y.w + un dis; 
Q.push(s_node(y. to, dis[y.to])); 


// 扩 展 新 的 邻居 , 放 到 优先 队列 中 
pre[y. to] = u. id; // 如 果 有 需要 ,记录 路 径 
} 
} 
} 
printf(" % d\n", dis[n]); 
//print_path(s, n); // 如 果 有 需要 ,打印 路 径 


上 
int main(){ 
while(~scanf("%d%d",gn,gm)) { 
if(n==0 && m== 0) return 0; 
for (int i=1;i<=n;it+) 
e[il].clear(); 
while (m-——){ 
int a,b,c; 
scanf("%d%d%d",&a,&b, &c); 
e[al]. push_back(edge(a, b, c)); 
// 结 点 a 的 邻居 ,都 放 在 node[a] 里 
e[b]. push_back(edge(b,a, c)); 
} 
dijkstra(); 


} 


打印 最 短路 径 。 和 前 面 的 Bellman-Ford 算法 一 样 ,Dijkstra 打印 最 短路 径 也 非常 容易 ， 
原理 和 Bellman-Ford 完全 一 样 。 首 先 定义 pre[] 记 录 前 驱 结 点 ,然后 用 print_path() 打 印 整 
个 路 径 。 具 体内 容 见 程序 。 

链 式 前 向 星 。 当 图 十 分 巨大 时 ,需要 用 链 式 前 向 星 存 图 。 请 读者 自己 总 结 模 板 , 并 做 
hdu 1535 题 。 


【习题 】 


最 短路 径 的 题目 很 多 ,下 面 列 出 了 一 些 训练 题 。 
poj 1860/3259/1062/3037/3615/1511/3159( 把 差分 约束 转换 为 最 短路 径 ) 。 
hdu 1874/1596/2433/2680/4889/4568( 最 短路 径 十 状态 压缩 DP) 。 


10.10 最 小 生成 树 


最 小 生成 树 是 无 向 图 中 的 一 个 问题 ,也 很 常见 。 
在 无 向 图 中 ,连通 而 且 不 含有 圈 ( 环 路 ) 的 图 称 为 树 。 最 小 生成 树 (Minimal Spanning 
Tree,MST) 的 基本 模型 可 以 用 下 面 的 题目 描述 : 
i 3 地 
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hdu 1233“ 还 是 畅通 工程 ” 
用 个 村 庄 需 要 修 通 道路 ,已 知 每 两 个 村 庄 之 间 的 距离 , 问 怎么 修 路 ,使 得 所 有 村 
庄 都 连通 (但 不 一 定 有 直接 的 公路 相连 ,只 要 能 间接 通过 公路 到 达 即 可 ), 并 且 道 路 总 长 
度 最 小 ? 请 计算 最 小 的 公路 总 长 度 。 


图 的 两 个 基本 元 素 是 点 和 边 ,与 此 对 应 ,有 两 种 方法 可 以 构造 最 小 生成 树 了。 这 两 种 算 
法 都 基于 贪心 法 ,因为 MST 问题 满足 贪心 法 的 “最 优 性 原理 ”, 即 全 局 最 优 包含 局 部 最 优 。 
prim 算法 的 原理 是 “最 近 的 邻居 一 定 在 MST 上 ”,kruskal 算法 的 原理 是 “最 短 的 边 一 定 在 
Ms EE 

(1) prim 算法 : 对 点 进行 贪心 操作 。 从 任意 一 个 点 u 开始 ,把 距离 它 最 近 的 点 wv 加 入 
到 T 中 ; 下 一 步 ,把 距离 {w,v} 最 近 的 点 zw 加 入 到 T 中 ; 继续 这 个 过 程 ,直到 所 有 点 都 在 
工 中 。 

(2) kruskal 算法 : 对 边 进行 贪心 操作 。 从 最 短 的 边 开 始 , 把 它 加 入 到 工 中 ; 在 剩 下 的 
边 中 找 最 短 的 边 , 加 入 到 工 中 ; 继续 这 个 过 程 ,直到 所 有 边 都 在 工 中 。 

在 这 两 个 算法 中 ,重要 的 问题 是 判断 轿 。 最 小 生成 树 显然 不 应 该 有 圈 , 否则 就 不 是 “最 
小 ?了 。 所 以 ,在 新 加 入 一 个 点 或 者 边 的 时 候 要 同时 判断 是 否 形成 了 圈 。 


10.10.1 prim 算法 


图 10. 25 说 明了 prim 算法 的 步骤 。 设 最 小 生成 树 中 的 点 的 集合 是 U, 开 始 时 最 小 生成 
树 为 空 ,所 以 U 为 空 。 


Qn O09 © 二 人 


(a) (b) (c) (d) 
图 10.25 prim 算 法 


(1) 任 取 一 点 ,例如 点 1, 放 到 U 中 ,U={1), 见 图 10. 25(a)。 

(2) 找 离 集合 U 中 的 点 最 近 的 邻居 , 即 1 的 邻居 ,是 2, 放 到 UU 中 ,U=={1,2}, 见 图 10.25(b)。 

(3) 找 离 U 最 近 的 点 ,是 5,U 一 {1,2.5}, 见 图 10. 25(c)。 

(4) 与 U 距离 最 短 的 是 1、5 之 间 的 边 , 但 是 它 没 扩 展 新 的 点 ,不 符合 要 求 , 见 图 10. 25(d) 。 

(5) 加 入 4,U 一 {1,2,5,4}, 见 图 10. 25(e) 。 

(6) 加 入 3,U 一 41,2.5,4,3}。 所 有 点 都 在 U 中 ,结束 , 见 图 10. 25(f) 。 

上 面 的 步骤 和 Dijkstra 算法 的 步骤 非常 相似 .不 同 的 是 Dijkstra 需要 更 新 U 的 所 有 邻 
居 到 起 点 的 距离 , 即 “ 松 弛 ”, 而 prim 不 需要 。 所 以 ,只 要 把 Dijkstra 的 程序 简化 一 些 即 可 。 

和 Dijkstra 一 样 ,prim 程序 如 果 用 优先 队列 来 查找 距离 U 最 近 的 点 ,能 优化 算法 ,此 时 
复杂 度 是 O(ElogsV)。 

prim 的 编程 比较 麻烦 ,下面 的 kruskal 算法 是 一 种 既 简单 又 高 效 的 算法 。 
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10.10.2 kruskal 算法 


kruskal 算法 编程 有 以 下 两 个 关键 技术 : 

(1) 对 边 进 行 排序 。 可 以 用 STL 的 sort() 函数 ,排序 后 ,依次 把 最 短 的 边 加 入 到 工 中 。 

(2) 判断 圈 , 即 处 理 连通 性 问题 。 这 个 问题 用 并 查 集 简单 而 高 效 , 并 查 集 是 kruskal 算 
法 的 绝 配 。 

仍 以 上 面 的 图 为 例 说 明 kruskal 算法 的 操作 步骤 ,如 图 10. 26 所 示 。 
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10. 26 ”kruskal 算法 
(1) 初始 时 最 小 生成 树 荆 为 空 , 见 图 10.26(1)。 令 S 是 以 结 点 i 为 元 素 的 并 查 集 ,在 开 


始 的 时 候 , 每 个 点 属于 独立 的 集 (为 了 便于 讲解 ,下 表 中 区 分 了 结 点 i 和 集 S, 把 集 的 编号 加 
上 了 下 夯 线 ) : 


sil 3 | 4 
i 9 2 3 4 


I 


(2) 加 入 第 一 个 最 短 边 (1-2) : T=={1-2}, 见 图 10. 26(2)。 在 并 查 集 S 中 ,把 结 点 2 合 
并 到 结 点 1, 也 就 是 把 结 点 2 的 集 2 改 成 结 点 1 的 集 1。 


| 和 | 
i 和 2 


(3) 加 入 第 二 个 最 短 边 (3-4) : T= 二 {1-2,3-4} , 见 图 10. 26(3) 。 在 并 查 集 S 中 , 结 点 4 合 
并 到 结 点 3。 


s | 1 1 弛 |" 疙 


i 人 2 3 4 


(4) 加 入 第 三 个 最 短 边 (2-5) : T= 二 {1-2,3-4,2-5} , 见 图 10. 26(4) 。 在 并 查 集 S 中 ,把 结 
点 5 合并 到 结 点 2, 也 就 是 把 结 点 5 的 集 5 改 成 结 点 2 的 集 1。 在 集 1 中 ,所 有 结 点 都 指向 了 
根 结 点 ,这样 做 能 避免 并 查 集 的 长 链 问题 。 具 体 原理 见 5. 1 节 的 “路 径 压 缩 ” 的 讲解 。 


攻 恒 医 古 医 到 区 到 本 
1 2 3 4 5 


(5) 第 四 个 最 短 边 (1-5), 见 图 10. 26(5) 。 检 查 并 查 集 ,发现 5 已 经 属于 集 1, 丢 弃 这 
个 边 。 这 一 步 实 际 上 是 发 现 了 一 个 圈 。 并 查 集 的 作用 就 体现 在 这 里 。 
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(6) 加 入 第 五 个 最 短 边 (2-4) , 见 图 10. 26(6) 。 在 并 查 集 S 中 ,把 结 点 4 的 集 并 到 结 点 2 
的 集 。 注 意 这 里 结 点 4 原来 属于 集 3 ,实际 上 的 修改 是 把 结 点 3 的 集 3 改 成 1。 


S | 二 | 让 | 过 1 
i 小 | 洛 4 5 


(7) 对 所 有 边 执行 上 述 操作 ,直到 结束 。 读 者 可 以 练习 加 最 后 两 个 边 (3-5)、(4-5) ,这 两 
个 边 都 会 形成 圈 。 
下 面 是 hdu 1233 题 的 程序 。 
hdu 1233 题 代码 : kruskal 十 并 查 集 


#include <bits/stdc++.h> 
using namespace std; 
const int NUM = 103; 
int S[NUM]; // 并 查 集 
struct Edge {int u, v, w;} edge[ NUM * NUM]; // 定 义 边 
bool cmp(Edge a, Edge b) { returna.w<b.w;} 
int find(int u) { return S[u] == u? u: find(S[u]); } 
// 查 询 并 查 集 ,返回 u 的 根 结 点 

int n, m; // 点 , 边 
int kruskal() { 

int ans = 0; 

for(int i=1; i<=n; i++) 

S[i]=i; // 初 始 化 ,开始 时 每 个 村 庄 都 是 单独 的 集 
sort(edge+ 1，edge+ 1 +m cmp); 


for(int i = 1; i<=m; i++) { 


int b = find(edge[i].u); // 边 的 前 端点 u 属 于 哪个 集 
int c = find(edge[i].v); // 边 的 后 端点 v 属 于 哪个 集 
if(b == c) continue; // 产 生 了 圈 , 丢弃 这 个 边 
s[c] = b; // 合 并 
ans += edge[i].w; // 计 算 MST 

} 

return ans; 


} 
int main() { 
while(scanf("%d", gn), n) { 
m= nx*(n-1)/2; 
for(int i = 1; i<=m; i++) // 在 题目 中 ,点 的 编号 从 1 开始 
scanf("%d%d%d", &edge[i].u, &edge[i].v, &edge[i].w); 
printf(" % d\n", kruskal( )); 
} 
return 0; 


lL 


kruskal 算法 的 复杂 度 包括 两 部 分 , 即 对 边 的 排序 O(ElogsE)、 并 查 集 的 操作 O(E) ,一 
共 是 O(ElogsE 十 EE) , 约 等 于 O(ElogsE) ,时 间 主 要 花 在 排序 上 。 
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与 prim 相 比 ,kruskal 的 编码 更 简单 ,复杂 度 也 好 ,更 受 人 们 欢迎 。 不 过 ,如 果 图 的 边 很 
多 ,kruskal 的 复杂 度 要 差 一 些 。 简 单 地 说 ,kruskal 适用 于 稀 琉 图 ,prim 适用 于 稠密 图 。 


【习题 】 


最 小 生成 树 算法 有 一 些 扩展 问题 ,例如 最 大 生成 树 、 次 小 生成 树 、 最 小 瓶颈 生成 树 等 , 见 
下 面 的 习题 。 

hdu 1102 ,简单 题 。 

hdu 3938 ,离线 算法 。 

poj 2377 ,最 大 生成 树 。 

hdu 5627, 最 大 生成 树 。 

hdu 4081 ,次 小 生成 树 。 

hdu 4126/4756 ,次 小 生成 树 。 用 kruskal 会 超时 ,需要 结合 prim 和 树 形 DP。 

hdu 4750, 最 小 瓶颈 生成 树 。 


10.11 最 大 流 


最 大 流 问 题 (Maximum Flow Problem) 是 网 络 流 中 的 基本 问题 , 它 是 基于 有 向 图 的 。 
最 大 流 问 题 的 解决 有 助 于 解决 其 他 网 络 流 问题 ,例如 最 小 割 、 二 分 图 匹配 等 。 
最 大 流 问题 在 生活 中 常见 的 原型 是 水 流 问题 。hdu 1532 题 描述 了 这 个 模型 。 


hdu 1532 “Drainage Ditches” 
约翰 在 农场 建造 了 一 套 排 水 沟 ,以 便 下 雨 时 把 池塘 的 水 排放 到 附近 的 溪流 中 。 的 
翰 还 在 每 个 水 沟 的 入 口 安装 了 调节 器 ,可 以 控制 水 流入 该 水 沟 的 速度 。 
约翰 不 仅 知道 每 个 水 沟 每 分 钟 可 以 运输 多 少 加 仑 的 水 ,而 且 还 知道 水 沟 的 确切 布 
局 ,水 在 这 些 水 沟 里 相互 进入 和 流动 。 对 于 任何 给 定 的 水 沟 ,水 只 沿 一 个 方向 流动 。 水 
可 能 在 某 些 水 沟 里 钨 转子 。 
求 源 点 1( 就 是 水 塘 ) 到 终点 M( 就 是 溪流 ) 的 最 大 流速 。 


在 计算 机 网 络 中 有 带宽 的 概念 , 即 每 秒 可 传送 的 数据 流量 ,和 水 流 这 个 模型 是 一 样 的 。 

另外 一 个 最 大 流 模型 的 例子 是 道路 的 宽度 。 道 路 有 单车 道 、 双 车 道 .四 车 道 , 同 时 能 开 
行 的 车 辆 数量 不 同 。 这 些 不 同道 路 的 运输 能 力 是 不 同 的 。 注 意 这 里 需要 假设 所 有 车 的 速度 
都 一 样 。 

在 10. 9 节 中 曾 提 到 “可 加 性 参数 ”和 “最 小 性 参数 ”"。 最 大 流 问 题 的 水 流 、 带 宽 和 宽度 都 
是 “最 小 性 参数 "。 例 如 ,一 条 路 径 上 的 最 大 水 流 由 这 条 路 径 上 水 流 容 量 最 小 的 那 条 边 决定 ， 
也 就 是 说 ,由 这 条 路 径 上 的 “瓶颈 ”决定 。 

最 大 流 问 题 就 是 求 两 点 间 ( 分 别称 为 源 点 、 汇 点 ) 的 最 大 流速 ,图 中 的 任何 点 都 可 以 作为 
它们 的 中 转 。 在 求 最 大 流 时 需要 满足 以 下 3 个 性 质 : 

(1) 流量 守恒 。 从 源 点 * 流出 的 流量 和 到 达 汇 点 t 的 流量 相等 ; 其 他 所 有 中 转 点 ,流入 
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和 流出 相等 。 

(2) 反对 称 性 。 设 从 x 到 的 流量 是 F(x,o),o 到 x 的 流量 是 f(v,w) ,那么 FCuyu) 一 
—f(vsu)。 

(3) 容量 限制 。 每 个 边 的 实际 流速 不 大 于 最 大 流速 (把 最 大 流速 称 为 容量 ) 。 

算法 需要 搜索 所 有 的 点 和 边 。 

最 大 流 算法 有 很 多 种 ,基本 上 分 为 两 类 : 

(1)“ 增 广 路 ”算法 。 例 如 Edmonds-Karp 算法 .Dinic 算法 。 

(2)“ 预 流 推进 "算法 。 例 如 ISAP 算法 。 

Edmonds-Karp 算法 比较 容易 ,但 是 效率 不 高 ,在 竞赛 中 一 般 使 用 Dinic 算法 和 ISAP 
算法 。 

在 学 习 有 效 的 最 大 流 算法 之 前 ,读者 可 以 自己 思考 暴力 法 或 者 简单 的 贪心 法 。 


10.11.1 Ford-Fulkerson 方 法 


Edmonds-Karp 算法 是 Ford-Fulkerson 方法 的 一 种 实现 。 所 谓 Ford-Fulkerson 方法 ， 
是 一 种 非常 容易 理解 的 算法 思想 : 

(1) 在 初始 的 时 候 , 所 有 边 上 的 流量 为 0。 

(2) 找到 一 条 从 s 到 + 的 路 径 , 按 3 个 性 质 得 到 这 条 路 径 上 的 最 大 流 , 更 新 每 个 边 的 残 
留 容量 。 残 留 容量 在 后 续 步 骤 中 继续 使 用 。 

(3) 重复 步骤 (2) ,直到 找 不 到 路 径 。 

以 图 10. 27 为 例 ? ,图 Ca) 中 的 斜体 数字 标 出 了 每 个 边 的 容量 ,开始 时 每 个 边 的 流量 是 
0; 图 10.27(b) 是 第 1 次 迭代 ,找到 了 一 条 路 径 ;>a->t, 画 线 数字 是 每 个 边 的 流量 ,斜体 数 
字 是 残留 容量 ; 图 10. 27(c) 是 第 2 次 迭代 ,找到 了 一 条 路 径 ;一 b>t, 更 新 每 个 边 的 流量 和 
残留 容量 。 第 2 次 迭代 后 没有 新 的 路 径 , 结 束 ( 注 意 : 这 里 为 了 介绍 思想 ,简化 了 过 程 ; 这 
实际 上 是 有 错误 的 ,解释 见 下 面 的 “残留 网 络 ”) 。 


(b) 第 1 次 迭代 (0) 第 2 次 迭代 
10. 27 ”Ford-Fulkerson 方法 示意 


Ford-Fulkerson 方法 基本 上 就 是 上 述 的 思路 。 它 有 3 个 思想 ,也 是 后 文 将 提 到 的 “最 大 
流 最 小 制定 理 ” 的 基础 : 

(1) 残留 网 络 (residual network)。 和 迭代 后 残留 容量 所 产生 的 图 ,每 次 新 的 迭代 在 上 一 
次 的 残留 网 络 上 进行 。 

但 是 , 它 实际 上 并 不 是 图 10.27(a)、(b)、(c) 中 的 斜体 数字 所 表示 的 图 ,因为 这 个 图 在 


中 ”这 个 例子 过 于 简单 ,更 完整 的 例子 请 参考 (算法 导论 ),Thomas H. Cormen 等 著 , 潘 金贵 等 译 ,机 械 工业 出 版 社 ， 
26.2 节 ,图 26-5。 
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(c) 残留 网 络 (d) 第 2 个 路 径 (e) 残留 网 络 
10.28 残留 网 络 


对 于 图 10. 28(a) 上 的 最 大 流 ,容易 发 现 ,在 sa-t 、s-b-t 这 两 条 路 径 上 最 大 流 等 于 2。 

下 面 找 一 条 路 径 。 图 10. 28(b) 是 搜 到 的 第 1 个 路 径 (读者 可 以 想象 sb .a-t 原来 不 存在 
水 沟 ) ,产生 的 流量 是 1; 图 上 的 数字 是 残留 容量 。 如 果 在 这 个 图 上 继续 搜索 路 径 , 已 经 没有 
新 路 径 。 这 显然 是 不 对 的 。 其 原因 是 第 1 次 搜索 的 结果 影响 了 后 续 的 路 径 搜索 。 那 么 如 何 
消除 这 个 影响 ? 

图 10. 28(c) 是 解决 方法 ,在 上 一 次 的 路 径 上 补充 反 向 路 径 ,其 值 就 是 用 过 的 流量 1, 形 
成 的 新 网 络 图 就 是 残留 网 络 。 

残留 网 络 的 原理 可 以 这 样 理解 : 在 搜索 新 的 增 广 路 时 ,可 能 会 经 过 以 前 的 增 广 路 使 用 
过 的 水 沟 ,而 这 个 新 路 的 水 流 可 能 与 原来 的 水 流 相 反 , 所 以 需要 补 上 反 向 路 径 ,让 新 的 搜索 
有 有 反 向 水 流 的 机 会 。 

图 10. 28(d) 是 在 图 10. 28(c) 的 基础 上 搜 到 的 第 2 个 路 径 ,这 次 结果 是 对 的 。 

图 10. 28(e) 是 最 后 的 残留 网 络 。 此 时 ,从 s 到 ,在 残留 网 络 上 不 存在 新 的 路 径 , 结 束 。 
为 加 深 理解 ,请 读者 验证 并 思考 : 最 后 的 残留 网 络 ,两 点 之 间 反 向 路 径 的 值 就 是 两 点 之 间 的 
实际 流量 。 所 以 ,可 以 利用 残留 网 络 输出 最 大 流 时 各 水 沟 中 的 实际 流量 。 

残留 网 络 和 残留 网 络 的 反 向 路 径 是 Ford-Fulkerson 方法 最 关键 的 技术 。 

(2) 增 广 路 Caugmenting path) 。 在 残留 网 络 上 找到 的 一 条 从 到 + 的 路 径 。 

(3) 割 (cut)。Ford-Fulkerson 方法 的 正确 性 是 最 大 流 最 小 割 定 理 的 推论 : 一 个 流 是 最 
大 流 , 当 且 仅 当 它 的 残留 网 络 不 包含 增 广 路 径 时 。 

Ford-Fulkerson 方法 的 运行 时 间 依 赖 于 增 广 路 径 的 搜索 次 数 。 虽 然 用 BFS 或 者 DFS 
都 行 ,但 是 DFS 这 种 深度 搜索 模式 可 能 陷 人 长 时 间 的 迭代 ,图 10. 29 是 一 个 例子 。 

在 图 10.29(b) 和 (c) 中 ,很 不 幸 地 ,DFS 选择 了 sb-a-t 和 s-a-b-t 这 种 绕 路 , 接 下 来 又 反 
复 选 择 这 两 个 路 径 。 在 到 达 终 点 图 10. 29(d) 前 , 共 迭 代 了 约 200 次 。 

如 果 用 BFS, 几 次 就 够 了 。 
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(c) 第 2 次 DFS (d) 最 后 的 残留 容量 


10.29 DFS 模式 陷入 长 时 间 的 迭代 


10.11.2 ” Edmonds-Karp 算法 
如 果 用 BFS 来 计算 增 广 路 径 , 就 是 Edmonds-Karp 算法 。 
复杂 度 : 经 过 O(VE) 次 BFS 迭代 ,所 有 增 广 路 被 找到 ; 一 次 BFS 的 时 间 是 OC(E), 所 


以 总 时 间 是 O(VE?)。 
由 于 Edmonds-Karp 算法 的 复杂 度 高 ,只 能 用 于 小 图 ,所 以 用 邻接 矩阵 存 图 就 行 了 。 


下 面 是 hdu 1532 题 的 代码 ,用 矩阵 graph[]L] 存 图 , 它 同时 也 用 于 记录 更 新 后 的 残留 网 


络 。 
hdu 1532 题 的 代码 


# include < bits/stdc++.h> 
const int INE = le9; 
const int maxn = 300; 
using namespace std; 
int n, m, graph[maxn][maxn], pre[maxn]; 
//graph[ ][ ] 不 仅 记录 图 ,还 是 残留 网 络 
int bfs(int s, int t){ 
int flow[maxn]; 
memset (pre, 一 1, sizeof pre); 
flow[s] = INF; pre[s] = 0; 
queue< int> 0; Q.push(s); 
while(!Q. empty()){ 
intu = Q.front(); Q.pop(); 
if(u== 七 ) break; 


// 初 始 化 起 点 
// 起 点 人 栈 , 开 始 BFS 


// 搜 到 一 个 路 径 , 这 次 BFS 结束 


for(int i=1; i<=m; i++){ //BFS 所 有 的 点 
if(il= s && graph[u][i]>0 && pre[i] == -1){ 
pre[i] = u; // 记 录 路 径 
Q. push(i); 
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flow[i] = min(flow[u],graph[u][i]); // 更 新 结 点 流量 


} 

if(pre[t] == —1) return 一 17; // 没 有 找到 新 的 增 广 路 

return flow[t]; // 返 回 这 个 增 广 路 的 流量 
} 
int maxflow(int s, int t+){ 

int Maxflow = 0; 

while(1){ 

int flow = bfs(s,t); 
// 执 行 一 次 BFS, 找到 一 条 路 径 , 返 回路 径 的 流量 


if(flow == 一 1) break; // 没 有 找到 新 的 增 广 路 ,结束 
int cur = t; // 更 新 路 径 上 的 残留 网 络 
while(cur!= s){ // 一 直 沿 路 径 回溯 到 起 点 
int father = pre[cur]; //pre[ ] 记 录 路 径 上 的 前 一 个 点 
graph[ father][cur] -= flow; // 更 新 残留 网 络 : 正 向 减 
graph[cur][father] += flow; // 更 新 残留 网 络 : 反 向 加 


cur = father; 
} 
Maxflow += flow; 
} 
return Maxflow; 
} 
int main(){ 
while(~scanf("%d%d",gn, gm)){ 
memset (graph, 0, sizeof graph); 
for(int i=0; i<n; i++){ 
int u,v,w; 
scanf("%d%d%d", &u, &v, &w); 
graph[u][v] += w; // 可 能 有 重 边 
} 
printf(" % d\n", maxflow(1,m)); 
} 
return 0; 


} 


最 大 流 的 建 模 问 题 。 前 面 最 大 流 的 模型 是 基于 有 向 图 的 ,而 且 只 有 一 个 源 点 和 一 个 汇 
点 ,但 是 题目 所 给 的 条 件 不 一 定 这 么 严格 ,此 时 需要 转换 为 下 面 的 模型 。 

(1) 无 向 图 转换 为 有 向 图 。 如 果 给 的 是 无 向 图 ,可 以 把 wv 之 间 的 无 向 边 变 为 (u,v)、 
(v,w 两 个 有 向 边 , 容 量 一 样 。uw 的 实际 流量 为 两 者 的 实际 流量 之 差 , 即 互相 抵消 ,例如 从 
u 到 ww 的 流量 是 10, 从 vv 到 zx 的 流量 是 4, 那 么 从 w 到 w 的 流量 是 10 一 4 二 6。 

(2) 多 个 源 点 和 多 个 汇 点 。 此 时 可 以 添加 一 个 “超级 源 点 ”s 和 一 个 “超级 汇 点 ”t+。 从 s 
到 每 个 源 点 都 连 一 条 有 向 边 ; 从 每 个 汇 点 都 连 一 条 边 到 +。 边 的 容量 根据 题目 要 求 灵活 
指定 。 

在 10. 13 节 中 ,例题 poj 2135“Farm Tour” 就 用 到 了 这 两 个 转换 方法 。 在 10. 14 节 中 
有 多 源 点 ,多 汇 点 的 情况 。 
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10.11.3 Dinic 算法 和 1ISAP 算法 


Edmonds-Karp 算法 的 效率 低 ,在 竞赛 时 若 遇 到 规模 较 大 的 最 大 流 问 题 ,需要 用 高 效 的 
Dinic 算法 和 ISAP 算法 。 

Dinic 算法 是 对 Edmonds-Karp 算法 的 优化 ,时 间 复 杂 度 理论 上 是 O(V?E) ,实际 上 更 
好 , 比 Edmonds-Karp 算法 的 O(VE?) 强 很 多 。 

ISAP 算法 的 复杂 度 也 是 O(V?*E) ,但 是 比 Dinic 算法 更 好 一 些 ,更 受 欢迎 。 

Dinic 算法 和 ISAP 算法 ?相当 复杂 ,代码 也 比 Edmonds-Karp 算法 长 得 多 ,在 竞赛 的 时 
候 靠 自己 写 出 来 很 困难 。 建 议 读者 阅读 有 关 资 料 , 搞 懂 原 理 , 学 习 其 思想 ; 然后 找到 合适 的 
模板 ,特别 是 ISAP 算法 ,学 会 使 用 它 , 在 比赛 的 时 候 带 上 。 

下 面 用 最 大 流 求解 混合 图 的 欧 拉 回 路 。 

最 大 流 算法 是 网 络 流 算法 的 基础 , 它 有 很 多 应 用 。 例 如 ,最 大 流 算法 可 用 于 判断 和 求解 
混合 图 的 欧 拉 回路 。 请 读者 先 回 顾 10. 5 节 。 


hdu 1956 “Sightseeing Tour” 
给 定 一 个 图 ,其 中 同时 存在 有 向 边 和 无 向 边 , 问 该 图 是 否 存在 欧 拉 回路 。 


有 向 图 存在 欧 拉 回路 的 充 要 条 件 是 所 有 点 的 度数 为 0。 把 每 个 点 连接 的 无 向 边 改 成 有 
向 边 ,看 度数 是 否 为 0。 但 是 无 向 边 很 多 ,情况 复杂 ,不 能 直接 用 暴力 的 方法 做 。 

读者 可 以 先 思考 ,尝试 用 最 大 流 方法 解决 。 然 后 阅读 下 面 的 解 题 思路 。 

把 所 有 的 无 向 边 任意 定 个 方向 ,把 这 个 包括 原来 的 有 向 边 和 设 定 了 方向 的 无 向 边 的 图 
称 为 初始 图 G, 然 后 计算 每 个 点 的 度数 。 点 i 的 度数 degree[ 门 二 出 度 一 入 度 , 有 以 下 两 种 
情况 : 

(1) 存在 一 个 degree[ 门 为 奇数 。 如 果 把 i 的 一 个 无 向 边 改 个 方向 ,那么 degree[ 门 变 为 
degree[ 让 十 2 或 degree[ 革 一 2 ,仍然 是 奇数 ,不 会 等 于 0, 所 以 不 存在 欧 拉 回路 。 

(2) 所 有 的 degree[ 站 全 是 偶数 。 可 以 把 某 个 i 的 一 个 无 向 边 改 个 方向 ,degree[ 门 变 为 
0。 那 么 是 否 所 有 的 点 的 度数 都 能 变 为 0 呢 ? 可 以 借助 最 大 流 来 判断 。 

下 面 用 初始 图 G 建 一 个 新 图 G ,在 G 中 计算 得 到 的 degree[ 丫 也 用 于 建 图 。 首先 把 初始 图 
G 中 原来 的 有 向 边 删 除 ,保留 定向 了 的 无 向 边 。 然 后 建 一 个 源 点 s, 连 接 所 有 的 degree[i]0 
的 点 , 边 的 容量 为 degree[ 让 /2。 建 一 个 汇 点 1, 把 所 有 degree[ 让 二 0 的 点 连接 到 1, 容量 为 
degree[i]/2。 其 他 degree[ 门 =0 的 点 就 不 用 连接 s 和 上 了。 所 有 没有 连接 ; 和 + 的 边 , 容 量 
都 为 1。 

求 新 网 络 G' 的 最 大 流 。 如 果 从 * 出 发 的 所 有 边 都 满 流 , 则 存在 欧 拉 回路 。 把 所 有 的 有 
流 的 边 全 部 反 向 ,把 原 图 中 的 有 向 边 再 重新 加 入 ,就 得 到 了 一 个 有 向 欧 拉 回路 。 

上 述 算法 正确 吗 ? 或 者 说 ,上 述 算法 的 结果 能 使 得 所 有 点 的 度数 为 0 吗 ? 

分 3 种 情况 观察 : 


四 ”Dinic 算 法 和 ISAP 算 法 的 对 比 : https://www. cnblogs. com/zhsl/archive/2012/12/03/2800092. html( 永 久 网 
址 : https://perma. cc/LAP9-QH83)。 


= 262“。 


(1) 观察 源 点 s 所 连接 的 点 v, 是 否 能 得 到 degree(z) 王 0 的 结果 。 在 图 10. 30 所 示 的 例 
子 中 ,图 10. 30(a) 是 初始 图 G 的 局 部 ,v 在 G 中 有 4 个 边 ,degree[v] 二 4, 其 中 虚线 是 有 向 
边 ,在 G' 中 被 删除 了 , 剩 下 的 3 个 实 线 边 是 原来 的 无 向 边 ,把 方向 定 为 出 度 。 在 图 10. 30(b) 
中 ,加 上 源 点 s, 边 (s,v) 的 容量 是 degree[v]/2==2,v 的 其 他 边 的 容量 是 1。 经 过 最 大 流 的 计 
算 , 如 果 (s,v) 是 满 流 2, 生 成 了 图 10. 30(c) 中 粗 线条 表示 的 流 。 把 有 流 的 边 反 向 ,得 到 
图 10. 30(d) ,可 以 发 现 ,degree(z) 一 0, 符合 欧 拉 回 路 的 要 求 。 从 这 个 图 也 能 理解 为 什么 把 
边 (s,v) 的 容量 设 定 为 degree[v]/2。 


CE 


(a) 初始 图 G (b) G 图 (©) 计算 得 到 最 大 流 (d) degree(v)=0 
图 10.30 源 点 s 连 接 的 点 vw 


(2) 与 汇 点 t 连接 的 点 ,分 析 同 上 。 

(3) 不 与 和 + 连接 的 点 i, 是否 最 后 也 有 degree(i) = 二 0 的 结果 ?这 些 点 在 初始 图 G 中 有 
degree(i) 二 0。 在 G' 中 计算 最 大 流 的 路 径 时 ,如 果 增 广 路 经 过 了 点 i, 那 么 肯定 有 一 个 进 边 的 流 
和 一 个 出 边 的 流 ,把 这 两 个 边 同时 反 向 ,仍然 是 一 个 进 边 和 一 个 出 边 , 仍 保持 degree(i) 二 0。 

hdu 1956 的 数据 比较 大 ,需要 用 Dinic 或 ISAP 算法 。 


【习题 】 


hdu 3549“Flow Problem”, 最 大 流入 门 题 。 

hdu 4280“Island Transport” ,数据 规模 为 2<N,M 二 100 000。ISAP 模板 题 , 用 Dinic 
有 可 能 超时 。 

hdu 3472“HS BDC”。 有 个 单词 ,有 的 可 以 前 后 颠倒 ,看 是 否 可 以 将 n 个 单词 首尾 相 
连 。 混 合 图 欧 拉 回路 。 


10.12 最 小 割 


st 最 小 割 是 最 大 流 的 一 个 直接 应 用 

割 (cut) 和 st 制 的 概念 : 在 有 向 图 流 网 络 G=(V,E) 中 , 割 把 图 分 成 S 和 了 =V 一 S 两 
部 分 , 源 点 sE S, 汇 点 +€ET, 这 称 为 st 割 。 

在 图 10. 31 中 , 边 上 的 数字 标 出 了 流量 和 容量 ,s 和 
t 之 间 的 流量 是 14。 图 中 的 虚线 是 一 个 割 ,把 图 分 成 了 
S、T 两 部 分 。 

从 SS 到, 穿 过 制 的 净 流量 是 4 十 12 一 2 一 14。 显 
然 ,在 st 之 间 做 任意 制 , 流 经 这 个 割 的 净 流 量 都 相等 。 

S 经 过 这 个 割 到 了 的 容量 是 8 十 12 二 20, 分 别 是 边 
ac 和 bd。 也 就 是 说 ,如 果 把 边 ac 和 bd 去 掉 ,S 中 的 水 就 国生 
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不 能 流 到 工 。 注 意 在 计算 S 到 T 的 容量 时 不 要 算 从 工 到 S 的 反 向 容量 。 图 中 的 虚线 并 不 
是 一 个 最 小 割 ,读者 可 以 观察 最 小 割 在 哪里 。 
最 小 割 问题 是 针对 容量 的 ,就 是 找到 源 点 s 和 汇 点 t 之 间 容 量 最 小 的 制 。 

最 小 割 问题 可 以 形象 地 理解 为 : 为 了 不 让 水 从 * 流向 上 ,怎么 破坏 水 沟 代价 最 小 ? 被 破 
坏 的 水 沟 必然 是 从 ; 到 + 的 单 向 水 沟 。 

最 大 流 最 小 割 定理 : 源 点 s 和 汇 点 上 之 间 的 最 小 割 等 于 s 和 + 之 间 的 最 大 流 2。 

需要 注意 的 是 ,定理 中 的 最 大 流 是 指 流量 ,而 最 小 割 是 指 容量 。 

全 局 最 小 割 : 把 st 最 小 割 问 题 扩 展 到 全 局 ,有 全 局 最 小 割 问 题 。 

简单 的 思路 : 可 以 利用 最 小 割 最 大 流 定理 , 即 枚 举 每 个 点 当 作 汇 点 ,计算 出 它 的 最 大 
流 , 然 后 在 所 有 点 的 最 大 流 中 取 最 小 值 。 

但 是 这 样 做 的 复杂 度 很 高 , 枚 举 汇 点 要 O(V) ,Dinic 或 ISAP 算法 的 复杂 度 是 O(V?E)， 
总 复杂 度 是 O(V3E)。 

解决 此 类 问题 需要 用 Stoer-Wagner 算法 ,由 于 题目 比较 罕见 ,本 书 不 展开 介绍 。 读 者 
可 以 通过 poj 2914 “Minimum Cut” 来 了 解 。 


【习题 】 


普通 最 小 割 问 题 的 编码 就 是 最 大 流 算法 。 在 对 问题 正确 建 模 之 后 ,用 最 大 流 的 算法 思 
路 解决 。 

hdu 3251“Being a Hero”, 最 小 割 。 

poj 1815“Friendship”, 最 小 割 。 


~ 


人 


10.13 最 小 费用 最 大 流 


在 最 大 流 网 络 中 ,每 条 边 只 有 一 个 限制 条 件 , 例 如 容量 、 带 宽 等 ,这 是 “最 小 性 参数 ”, 现 
在 加 上 一 个 新 的 限制 条 件 , 例 如 费用 ,这 是 “可 加 性 参数 "。 在 两 个 限制 条 件 的 基础 上 引出 了 
最 小 费用 最 大 流 问 题 : 当 流 量 为 时 , 求 费用 最 小 的 流 ; 如 果 没 有 指定 下 ,就 是 求 最 大 流 时 
的 最 小 费用 。 

有 两 种 思路 : 

(1) 先 求 一 个 最 大 流 , 然 后 不 断 优化 得 到 最 小 费用 流 。 首 先 用 最 大 流 算法 得 到 一 个 最 
大 流 , 然 后 检查 边 的 情况 ,看 是 否 有 费用 更 小 同时 也 能 满足 最 大 流 的 边 ,如 果 有 ,就 进行 调整 ， 
得 到 一 个 新 的 最 大 流 。 经 过 多 次 迭代 ,直到 所 有 边 都 无 法 调整 ,就 得 到 了 最 小 费用 最 大 流 。 

(2) 从 零 流 开始 ,每 次 增加 一 个 最 小 费用 路 径 , 经 过 多 次 增 广 ,直到 无 法 再 增加 路 径 ,就 
得 到 了 最 大 流 。 

思路 (2) 更 容易 理解 和 操作 , 它 是 网 络 流 问 题 和 最 短路 径 问 题 的 结合 , 其 算法 也 是 最 大 
流 算法 和 最 短路 径 算法 的 结合 。 


Q@ 证 明 见 《算法 导论 ),Thomas H. Cormen 等 著 , 潘 金贵 等 译 ,机 械 工业 出 版 社 ,定理 26.7。 
* 264. 


第 10 章 图 论 


本 


最 短路 径 算 法 有 Bellman-Ford 算法 、Dijkstra 算法 等 ,是 否 都 能 用 ? 如 果 边 的 费用 权 值 
有 负数 ,只 能 选择 Bellman-Ford 算法 (或 SPFA 算法 )。 在 最 小 费用 最 大 流 算法 中 ,由 于 残 
留 网 络 用 到 了 反 向 边 , 所 以 肯定 会 出 现 负 权 边 9 ,在 本 节 的 例题 中 会 说 明 这 一 问题 。 

最 小 费用 最 大 流 的 解决 方法 是 Ford-Fulkerson 方法 十 Bellman-Ford 算法 (SPFA 算法 ) 。 

回顾 最 大 流 的 Ford-Fulkerson 方法 , 它 的 主要 操作 是 在 残留 网 络 上 不 断 寻 找 增 广 路 
径 。 如 果 用 BFS 求 增 广 路 ,就 是 Edmonds-Karp 算法 。BFS 求 增 广 路 是 很 盲目 的 , 它 不 会 
区 分 增 广 路 的 “好 坏 ”。 

如 何 找 一 条 “好 ”的 增 广 路 ? 如 果 不 用 BFS, 而 是 改 用 Bellman-Ford 算法 (SPFA 算 
法 ) ,每 次 在 残留 网 络 上 找 增 广 路 时 都 找 费 用 最 小 的 路 径 , 就 会 得 到 一 条 “好 ”的 、 费 用 最 低 的 
路 径 。 不 断 用 Bellman-Ford 算法 (SPFA 算法 ) 求 增 广 路 ,直到 满足 题目 要 求 的 流量 下 ,最 后 
得 到 一 个 流量 为 并 且 费 用 最 小 的 流 。 

上 述 的 算法 思想 是 否 正确 ?可 以 简单 思考 如 下 : 如 果 经 过 上 述 步骤 得 到 的 不 是 最 小 费用 
流 ,说 明 在 残留 网 络 上 还 存在 费用 更 小 的 路 径 , 这 与 前 面 步骤 中 已 经 计算 了 最 小 路 径 相 矛盾 2。 

算法 的 复杂 度 是 多 少 ? 找 一 次 增 广 路 ,这 个 路 径 上 至 少 有 一 个 流量 ; 总 流量 为 下 ,最 多 
需要 找 下 次 增 广 路 ; 每 次 使 用 Bellman-Ford 算法 找 增 广 路 ,一 次 Bellman-Ford 的 时 间 是 
OCVE ) ,所 以 总 时 间 是 OCFVE) 。 

对 于 下 面 的 例题 ,请 读者 先 思 考 ,再 看 答案 。 


poj 2135 “Farm Tour” 
一 个 无 向 图 ,有 N 个 地 点 、M 条 边 。 一 个 人 从 1 号 点 走 到 N 号 点 ,再 从 N 号 点 走 
回 ] 号 点 ,每 条 路 只 能 走 一 次 。 求 来 回 的 总 长 度 最 短 的 路 线 。 
输入 : 第 1 行 是 两 个 整数 NM; 后 面 有 M 行 ,每 行 有 3 个 整数 ,描述 一 个 边 的 两 个 
端点 和 边 的 长 度 。1 委 N 三 1000,1 志 M10 000。 
输出 : 来 回 总 长 度 最 短 的 路 径 长 度 。 
题目 的 测试 数据 确保 存在 来 回 的 不 重复 路 径 。 


根据 题 意 分 析 ,这 是 个 无 向 图 ,从 1 走 到 NN 和 从 N 走 到 1 是 
一 样 的 ,那么 题目 转换 为 从 1 号 点 到 N 号 点 至 少 有 两 条 不 同 路 
线 , 找 其 中 两 条 ,使 它们 的 总 长 度 最 短 。 
刚 看 到 这 一 题 的 时 候 ,读者 可 能 觉得 很 简单 : 先 求 第 一 个 最 
短路 径 ,然后 把 走 过 的 路 删除 ,再 算 一 次 最 短路 径 。 

然而 这 样 做 是 错误 的 。 例 如 图 10. 32, 找 a 到 d 的 两 条 路 。 图 10 sy 下 失利 了 之 间 
图 中 确实 存在 两 条 路 ,但 是 直接 算 两 次 最 短路 径 却 找 不 到 这 两 条 而 订 记名 
路 : 第 一 条 最 短路 径 是 ac-b-d ,有 3 个 边 ,如 果 删 除 这 3 个 边 ,图 
就 断 开 了 ,无 法 继续 找 第 二 条 路 。 


@@ 通过 导入 “ 势 " 的 概念 ,可 以 在 最 小 费用 最 大 流 算法 中 用 Dijkstra 算法 ,从 而 降低 算法 复杂 度 。 请 参考 (挑战 程序 
设计 竞赛 )( 秋 叶 拓 哉 ) ,225 页 ,“3. 5.6 最 小 费用 流 ”。 
回 ”算法 正确 性 的 具体 证 明 参 考 (挑战 程序 设计 竞赛 ) 秋 叶 拓 哉 ) ,225 页 “3. 5. 6 最 小 费用 流 ”。 
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这 个 例子 是 从 前 面 最 大 流 的 “残留 网 络 ” 的 例子 引用 过 来 的 。 这 个 例子 说 明 本 题 和 最 大 
流 有 关系 。 

这 一 题 实际 上 是 一 道 最 小 费用 最 大 流 的 裸 题 。 建 模 如 下 : 

把 每 条 边 的 流量 设 为 1 ,表示 每 条 边 只 能 用 1 次 ,把 边 的 长 度 看 成 每 个 边 的 费用 。 在 图 
中 添加 一 个 “超级 源 点 ”; 和 一 个 “超级 汇 点 ”i,s 到 1 有 一 个 长 度 为 0、 容量 为 2 的 边 ; N 到 1 
有 一 个 长 度 为 0、 容量 为 2 的 边 。 在 经 过 这 个 建 模 之 后 , 原 题 中 求 两 条 最 短路 径 的 费用 等 价 
于 求 源 点 s 和 汇 点 1 的 最 小 费用 最 大 流 了 。 

分 析 复 杂 度 ,最 小 费用 最 大 流 的 复杂 度 是 OC(FVE),F=2,V==1000,E=10 000,FVE= 
2000 万 ,正好 满足 。 

下 面 的 最 小 费用 最 大 流程 序 综合 了 SPFA 算法 和 最 大 流 算法 ,基本 上 套用 了 前 面 讲解 
过 的 模板 。 其 中 需要 特别 注意 的 是 图 的 初始 化 , 即 如 何 把 无 向 图 转 为 有 向 图 。 

无 向 图 的 两 个 点 (u,v) 之 间 只 有 1 个 边 ,本 题 把 它 变 成 了 4 个 边 。 

首先 把 无 向 边 (u,v) 分 成 有 向 边 (u,v) 和 (vu) 。 

然后 把 它们 各 分 成 两 个 边 。 例 如 有 向 边 (u,v) 变 成 了 一 个 正 向 的 费用 为 cost、 容 量 为 
capacity 的 边 , 以 及 一 个 反 向 的 费用 为 一 cost、 容 量 为 0 的 边 。 这 样 做 和 最 大 流 中 的 残留 网 
络 是 同样 的 道理 ,相当 于 一 次 增 广 之 后 生成 的 残留 网 络 。 如 果 读 者 不 能 理解 ,请 回顾 最 大 流 
中 * 反 向 路 径 ” 的 相关 内 容 。 

从 这 个 例子 可 以 看 出 , 边 的 权 值 会 出 现 负数 ,所 以 不 能 用 Dijkstra 算 最 短路 径 , 只 能 用 
SPFA。 


poj 2135 程序 (邻接 表 存 图 十 SPFA 十 最 大 流 ) 


# include < stdio.h> 

# include <algorithm> 

#include <cstring> 

#include < queue> 

using namespace std; 

const int INF = Ox3f3f3f3f; 

const int N = 1010; 

int dis[N], pre[N], preve[N]; 

//dis[i] 记 录 起 点 到 i 的 最 短 距离 .pre 和 preve 见 下 面 的 注释 


int n, m; 
struct edge{ 
int to, cost, capacity, rev; //rev 用 于 记录 前 驱 点 


edge( int to_, int cost_, int cv int rev_){ 
to = to_; cost = cost_; capacity= ci rev= rev_)} 

}; 
vector < edge > e[N]; //e[i]: 存 第 i 个 结 点 连接 的 所 有 的 边 
void addedge( int from, int to, int cost, int capacity){ // 把 1 个 有 向 边 再 分 为 两 个 

e[from]. push_back(edge(to, cost, capacity, e[to]. size())); 

e[to]. push back(edge(from, — cost, 0, e[from]. size() —1)); 
上 
bool spfa(int s, int t, int cnt){ // 套 SPFA 模板 


@ 从 这 一 题 的 建 模 过 程 可 以 看 出 , 单 源 最 短路 径 问题 是 费用 流 问题 的 一 个 特殊 情况 。 把 每 个 边 的 容量 设 为 1, 添 
加 一 个 源 点 s,s 到 起 点 的 边 容量 是 1、 费 用 是 0, 那 么 * 到 终点 的 最 小 费用 最 大 流 就 是 最 短路 径 。 
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bool ing[N]; 
memset(pre, —1, sizeof(pre)); 
for(int i = 1; i<=cnt; ++i) { dis[i] = INF; ing[i] = false; } 
dis[s] = 0; 
queue < int> Q; 
Q.push(s); 
ing[s] = true; 
while(!Q. empty()){ 
int u = Q. front(); 
Q. pop(); 
inq[u] = false; 
for(int i=0; i<e[u]. size(); i++) 
if(e[u][i].capacity> 0){ 
intv = ef[u][il].to, cost = e[u][il].cost; 
if(dis[u] + cost < dis[v]){ 
dis[v] = dis[u] + cost; 
pre[v] = u; /人 v 的 前 驱 点 是 
preve[v] = i; / 夕 的 第 并 个 边 连接 v 点 
证 (!inq[v]){ 
inq[v] = true; 


Q.push(v); 
} 
} 
} 
} 
return dis[t] != INF; //s 到 t+ 的 最 短 距 离 (或 者 最 小 费用 ) 是 dis[t] 
int mincost(int s, int t, int cnt){ // 基 本 上 是 套 最 大 流 模板 


int cost = 0; 
while(spfa(s, t, cnt)){ 
int v = t, flow = INF; // 每 次 增加 的 流量 
while(pre[v] != —1){ // 回 漳 整 个 路 径 ,计算 路 径 的 流 
int u = pre[v], i = preve[v]; 
/ 儿 是 v 的 前 驱 点 ,u 的 第 i 个 边 连接 v 
flow = min(flow, e[u][il].capacity); 
// 所 有 边 的 最 小 容量 就 是 这 条 路 的 流 


v= ui // 回 溯 , 直 到 源 点 

} 

1 

while(pre[v] != —1){ // 更 新 残留 网 络 
intu = pre[v]，i = preve[v]; 
e[u][i].capacity -= flow; // 正 向 减 
e[v][e[u][i].rev].capacity += flow; // 反 向 加 ,注意 rev 的 作用 
V= ui // 回 退 ,直到 源 点 


} 
cost += dis[t] * flow; 


// 费 用 累加 . 如果 程 序 需要 输出 最 大 流 ,在 这 里 累加 flow 


} 

return cost; // 返 回 总 费用 
} 
int main(){ 


while(~scanf("%d%d", gn, gm)){ 
for(int i = 0; i<N; i++) e[i].clear(); // 清 空 待 用 
for(int i = 1; i<=m; ++i){ 
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int u, v, w; 
scanf("%d%d%d", &u, &v, &w); 
addedge(u, v, w, 1); // 把 1 个 无 向 边 分 为 2 个 有 向 边 
addedge(v, u, w, 1); 
} 
ints = n+1l,t= n+2; 
addedge(s, 1, 0, 2); // 添 加 源 点 
addedge(n, t, 0, 2); // 添 加 汇 点 
printf(" % d\n", mincost(s, t, n+2)); 


return 0; 


【习题 】 


hdu 3376“Matrix Again”, 费 用 流 裸 题 。 
hdu 3667“Transportation ”。 
hdu 5520“Number Link”。 


10. 14 二 分 图 匹配 


[OD 

二 分 图 : 把 无 向 图 G=(V, 已) 分 为 两 个 集合 Vi .Vs, 所 有 的 边 都 在 Vi 和 ”视频 讲解 
Vz 之 间 , 而 Vi 或 Vs 的 内 部 没有 边 。Vi 中 的 一 个 点 与 Vs 中 的 一 个 点 关联 , 称 为 一 个 匹配 。 

一 个 图 是 否 为 二 分 图 ,一 般 用 “染色 法 ”进行 判断 。 用 两 种 颜色 对 所 有 顶点 进行 染色 ,要 
求 一 条 边 所 连接 的 两 个 相 邻 顶点 的 颜色 不 相同 。 染 色 结束 后 ,如 果 所 有 相 邻 顶点 的 颜色 都 
不 相同 , 它 就 是 二 分 图 。 

一 个 图 是 二 分 图 , 当 且 仅 当 它 不 含 边 的 数量 为 奇数 的 圈 。 读 者 可 以 画图 理解 这 一 点 。 

常见 的 二 分 图 匹配 问题 有 两 种 。 

(1) 无 权 图 , 求 包含 边 数 最 多 的 匹配 , 即 二 分 图 的 最 大 匹配 。 本 节 讲 解 这 个 问题 。 

(2) 带 权 图 , 求 边 权 之 和 尽量 大 的 匹配 。 使 用 KM 算法 ,本 书 没有 涉及 。 

1. 二 分 图 最 大 匹配 问题 

可 以 将 二 分 图 最 大 匹配 问题 转化 为 求 最 大 流 问 题 的 思想 来 解决 。 不 过 在 竞赛 时 一 般 不 
用 标准 的 最 大 流 模板 ,而 是 使 用 更 简单 的 匈牙利 算法 。 

二 分 图 最 大 匹配 的 原型 见 下 面 的 题目 。 


hdu 2063“ 过 山 车 ” 
大 家 去 坐 过 山 车 。 过 山 车 的 每 一 排 只 有 两 个 座位 ,并 且 必 须 一 男 一 女 配对 坐 。 但 
是 ,每 个 女孩 有 各 自 的 想法 ,比如 Rabbit 只 愿意 和 XHD 或 PQK 坐 ,Grass 只 愿意 和 
linle 或 LL 坐 ,等 等 。boss 刘 决 定 , 只 让 能 配对 的 人 坐 过 山 车 。 当 然 , 能 配对 的 人 越 多 
越 好 。 问 最 多 有 多 少 对 组 合 可 以 坐 上 过 山 车 ? 
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2. 用 最 大 流 求解 二 分 图 匹配 

二 分 图 最 大 匹配 问题 可 以 转化 为 最 大 流 问 题 : 把 每 个 边 都 改 为 有 向 边 ,流量 都 是 1; 在 
Vi 上 加 一 个 人 为 的 源 点 s, 它 连接 Vi 的 所 有 点 ; 在 V。 上 加 一 个 人 为 的 汇 点 z, 它 连接 Vs 的 
所 有 点 ,那么 st 之 间 的 最 大 流 就 是 最 大 二 分 图 匹配 。 


原理 很 直观 。 在 图 10. 33 中 ,Vi 二 {a,b,c} 是 女 @ 1 @) 
生 ,Vs 一 {x,y,z) 是 男生 。 例 如 a 点 ,流入 a 的 流量 BN 
是 1, 那 么 从 4 流出 的 只 能 是 1, 也 就 是 说 a 只 能 匹配 Gy-1-@ >@) -13D 
{zy 中 的 一 个 。 从 Vi 到 Vs 的 流量 和 从 s 到 1 的 ~、 ! be 
流量 相等 。 Oo 


下 面 用 最 大 流 来 求解 。 读 者 可 以 用 图 10. 34 复 
习 最 大 流 的 Ford-Fulkerson 方法 ,主要 是 对 残留 网 
络 的 操作 。 


图 10.33 二 分 图 匹配 和 最 大 流 


(©) 第 2 个 增 广 路 径 (d) 残留 网 络 
图 10. 34 用 最 大 流 来 求解 


(1) 找到 第 1 个 增 广 路 径 , 找 到 匹配 cz , 见 图 10. 34(a) 。 

(2) 更 新 残留 网 络 , 见 图 10. 34(b) 。 

(3) 找到 第 2 个 增 广 路 径 , 找 到 匹配 a-y 、b-zx。 在 这 一 步 把 原来 的 配对 a-z 改 为 a-y ,以 
成 全 bz 的 配对 ,这 就 是 残留 网 络 的 作用 , 见 图 10. 34(c)。 

(4) 更 新 残留 网 络 , 见 图 10. 34(d)。 

后 面 的 步骤 请 读者 做 练习 。 

3. 匈牙利 算法 

匈牙利 算法 可 以 看 成 最 大 流 的 一 个 特殊 实现 。 

由 于 二 分 图 是 一 个 很 简单 的 图 ,并 不 需要 按 上 面 的 图 解 做 标准 的 最 大 流 , 可 以 进行 
简化 。 

(1) 从 上 面 的 图 解 中 发 现 对 s 和 + 的 操作 是 多 余 的 ,直接 从 a、b、c 开始 找 增 广 路 径 就 可 
及 了 本 
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(2) 残留 网 络 上 的 增 广 路 需要 覆盖 完整 的 路 径 , 如 果 在 二 分 图 中 只 进行 {a,6,c} 到 {z， 
yx} 的 局 部 操作 ,将 简化 很 多 。 
下 面 是 hdu 2063 的 程序 。 
hdu 2063 匈牙利 算法 (邻接 矩阵 ) 


# include < bits/stdc++.h> 
using namespace std; 
int G[510][510]; 


int match[510], reserve boy[510]; // 匹 配 结果 在 match[ ] 中 
int k, m girl, n_boy; 
bool dfs(int x){ // 找 一 个 增 广 路 径 , 即 给 女孩 x 找 一 个 配对 男孩 


for(int i=1; i<=n boy; i++) 
if(!reserve boy[i] && G[x][i]){ 
reserve boy[i] = 1; // 预 定 男 孩 ,准备 分 给 女孩 x 
if(!match[i] || dfs(match[i])){ 
// 有 两 种 情况 : (1) 如 果 男 孩 i 还 没 配 对 ,就 分 给 女孩 x; 
//(2) 如 果 男 孩 i 已 经 配对 ,尝试 用 dfs() 更 换 原 配 女孩 ,以 腾 出 位 置 给 女孩 x 
match[i] = x; 
// 配 对 成 功 .如 果 原 来 有 配对 ,更 换 成 功 .现在 男孩 i 属于 女孩 x 
return true; 
} 
} 
return false; // 女 孩 x 没 有 喜欢 的 男孩 ,或 者 更 换 不 成 功 
} 
int main(){ 
while(scanf(" %d",&k)!= EOF && k){ 
scanf(" %d%d", gm girl,&n_boy); 
memset(G, 0, sizeof(G)); 
memset (match, 0, sizeof (match) ); 
for(int i=0;i<k;i++){ 
int a,b; 
scanf("% dg%d",&a,&b); 
Glal[b]=1; 
} 
int sum= 0; 
for(int i=1; i<=m girl; i++){ // 为 每 个 女孩 找 配对 
memset (reserve_boy, 0, sizeof (reserve_boy)); 
if(dfs(i)) sumt+; 
// 第 i 个 女孩 配对 成 功 ,这 个 配对 后 面 可 能 会 更 换 , 但 是 保证 她 能 配对 
} 
printf(" % d\n", sum); 
. 
return 0; 


} 


上 述 程 序 用 邻接 矩阵 , 找 一 次 增 广 路 径 的 时 间 复 杂 度 为 OC(V?) ,总 时 间 为 O(V3); 空 


间 复 杂 度 为 O(V?)。 
改 用 邻接 表 存 图 可 以 加 快 搜索 速度 。 找 一 次 增 广 路 径 的 时 间 复 杂 度 为 OC(V 十 EE) ,总 时 
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间 为 O(VE); 空间 复杂 度 为 O(V 十 E)。 读 者 可 以 练习 把 上 述 程 序 改 成 用 邻接 表 。 
【习题 】 


hdu 1083“Courses”, 简 单 题 。 

hdu 3729“Tm Telling the Truth”, 简 单 题 。 
hdu 5727 “Necklace”。 

hdu 3605“Escape”, 二 分 图 多 重 匹 配 。 


10.15 小 结 


本 章 讲解 了 很 多 图 论 问 题 , 关 键 的 知识 点 总 结 如 下 。 

(1) 图 的 存储 : 牢固 掌握 图 的 邻接 和 矩阵、 邻接 表 、 链 式 前 向 星 3 种 存储 方法 。 
(2) BFS 和 DFS 在 图 问题 中 的 关键 作用 : DFS 对 图 的 遍历 过 程 。 

(3) 拓扑 排序 : BFS 和 DFS 的 直接 应 用 。 

(4) 欧 拉 路 : DFS 的 直接 应 用 。 

(5) 无 向 图 连通 性 : 缩 点 的 方法 。 

(6) 有 向 图 连通 性 : DFS 的 深度 应 用 。 

(7) 2-SAT 问题 : 强 连通 分 量 和 拓扑 排序 的 应 用 。 

(8) 最 短路 径 : 透彻 掌握 各 种 最 短路 径 算法 的 思想 .数据 结构 、 编 程 .应 用 环境 。 
(9) 最 小 生成 树 : 贪心 法 思想 的 应 用 。 

(10) 最 大 流 : 网 络 流 的 基础 问题 ; 残留 网 络 、 增 广 路 的 方法 。 请 读者 透彻 掌握 。 
(11) 最 小 割 : 问题 建 模 。 

(12) 最 小 费用 最 大 流 : 最 短路 径 和 最 大 流 的 结合 。 

(13) 二 分 图 匹配 : 最 大 流 思想 的 应 用 。 
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局 二 维 几何 基础 
如 国 

吕 三 维 几何 

要 几何 模板 


几何 类 题目 是 算法 竞赛 中 的 一 个 大 类 考点 ,涉及 的 知识 点 有 平面 几何 、 解 析 几 何 、 计 算 
几何 等 。 

几何 题 的 代码 一 般 比 较 长 ,有 时 甚至 有 200 多 行 , 而 且 逻 辑 往 往 也 比较 复杂 ,是 典型 的 
考查 参赛 人 员 编码 能 力 的 题 型 。 

如 果 要 选 出 带 到 赛场 的 必 备 模板 ,其 中 一 定 会 包括 几何 模板 。 很 多 有 经 验 的 老 队员 说 : 
“做 几何 题 ,模板 很 重要 ,要 高 度 可 靠 1” 因 此 ,在 平时 的 训练 过 程 中 认真 总 结 模板 ,融会 贯通 ， 
才能 在 赛场 上 灵活 地 使 用 它们 。 


11.1 二 维 几 何 基础 


计算 几何 中 的 坐标 值 一 般 是 实数 ,在 编程 时 用 double 类 型 ,不 用 精度 较 低 的 float 类 
型 。double 类 型 读 入 时 用 %1 格式 ,输出 时 用 %f 格 式 。 回 

在 进行 浮 点 数 运算 时 会 产生 精度 误差 ,为 了 控制 精度 ,可 以 设置 一 个 偏差 乓 3 
值 eps(epsilon) ,eps 要 大 于 浮 点 运算 结果 的 不 确定 量 , 一 般 取 10，。 如 果 eps 喇 
取 10-*, 可 能 会 有 问题 ,例如 11. 2. 1 节 中 提 到 的 hdu 5572 题 ,用 10* 会 返 国 铭 
回 Wrong Answer。 视频 讲解 

判断 一 个 浮 点 数 是 否 等 于 0, 不 能 直接 用 “一 一 0" 来 判断 ,而 是 用 sgn() 函数 判断 是 否 小 
于 eps。 在 比较 两 个 浮 点 数 时 ,也 不 能 直接 用 *= = "判断 是 否 相等 ,而 是 用 demp() 函数 判 
断 是 否 相等 。 


const double pi = acos( -1.0); // 高 精度 圆周 率 
const double eps = le 一 8; // 偏 差 值 ,有 时 用 le- 10 
int sgn(double x){ // 判 断 x 是否 等 于 0 


if(fabs(x) < eps) return 0; 
else return x<0?—1:1; 
: 
int dcmp(double x, double y){ // 比 较 两 个 浮 点 数 : 0 为 相等 ; -1 为 小 于 ; 1 为 大 于 
if(fabs(x — Y) < eps) return 0; 
else return x<y?-1:1; 
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11.1.1 点 和 向 量 


1. 点 
二 维 平 面 中 的 点 用 坐标 (z，y) 来 表示 。 


struct Point{ 
double x, y; 
Point(){} 
Point(double x, double y) :x(x), y(y){} 
}; 
2. 两 点 之 间 的 距离 
(1) 把 两 点 看 成 直角 三 角形 的 两 个 顶点 , 斜 边 就 是 两 点 的 距离 。 用 库 函 数 hypot() 计 算 
直角 三 角形 的 斜 边 长 。 
double Distance(Point A, Point B){return hypot(A.x—B.x,A.y— B.y);} 


(2) 或 者 用 sqrt() 函数 计算 。 


double Dist(Point A,Point B){ 
return sqrt((A.x—B.x)* (A.x—B.x) + (A.y-B.y)* (A.y-B.y)); 
| 


3. 向 量 

有 大 小 .有 方向 的 量 称 为 向 量 ( 矢 量 ), 只 有 大 小 没有 方向 的 量 称 为 标量 。 

用 平面 上 的 两 个 点 可 以 确定 一 个 向 量 , 例 如 用 起 点 P! 和 终点 
P, 表示 一 个 向 量 。 不 过 ,为 了 简化 描述 ,可 以 把 它 平移 到 原点 ,把 
向 量 看 成 从 原点 (0,0) 指 向 点 (z,y) 的 一 个 有 向 线段 ,如 图 11. 1 所 
示 。 向 量 的 表示 在 形式 上 与 点 的 表示 完全 一 样 ,可 以 用 点 的 数据 结 
构 来 表示 向 量 : 


typedef Point Vector; 图 11.1 向 量 


注意 ,向 量 并 不 是 一 个 有 向 线段 ,只 是 表示 方向 和 大 小 ,所 以 向 量 平移 后 各 
仍然 不 变 。 a 
4. 向 量 的 运算 | 
在 struct Point 中 ,对 向 量 运算 重 载运 算 符 。 
(1) 加 : 点 与 点 的 加 法 运算 没有 意义 ; 点 与 向 量 相 加 得 到 另 一 个 点 ; 向 量 
与 向 量 相 加 得 到 另外 一 个 向 量 。 


Point operator + (Point B){return Point(x+B.x,y+B.y);} 
(2) 减 : 两 个 点 的 差 是 一 个 向 量 ; 向 量 A 减 B 得 到 由 B 指向 A 的 向 量 。 
Point operator - (Point B){return Point(x—- B.x,y- B.y);} 


向 量 的 加 法 和 减法 示意 图 如 图 11. 2 所 示 。 
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图 11.2 向 量 的 加 法 和 减法 
(3) 乘 : 向 量 与 实数 相 乘 得 到 等 比例 放大 的 向 量 。 
Point operator * (double k){return Point(xxk,yxk);} 
(4) 除 : 向 量 与 实数 相 除 得 到 等 比例 缩小 的 向 量 。 
Point operator / (double k){return Point(x/k, y/k);} 


(5) 等 于 : 


bool operator == (Point B){return sgn(x- B.x) ==0 && sgn(y- B.y) == 0;} 


11.1.2 点 积 和 又 积 


向 量 的 基本 运算 是 点 积 和 叉 积 ,计算 几何 的 各 种 操作 几乎 都 基于 这 两 种 运算 。 
1. 点 积 (Dot product) 
记 向 量 A 和 B 的 点 积 为 4。 了 ,定义 如 下 : 
A.B=|A||B| cosb 
其 中 0 为 4、B 之 间 的 夹 角 。 点 积 的 几何 意义 为 A 在 B 上 的 投影 
长 度 乘 以 B 的 模 长 。 点 积 的 几何 表示 如 图 11. 3 所 示 。 
在 编程 时 计算 点 积 并 不 需要 知道 9。 如 果 已 知 A 二 (A. x， 
A.y),B 二 (B. x,B.y) ,那么 有 : 
A.B=A.x*B.x+A.y*xB.y 
下 面 推导 这 个 公式 。 设 91 是 4 与 z 轴 的 夹 角 ,92 是 B 与 x 轴 的 夹 角 ,向 量 A 与 B 的 
夹 角 9 等 于 遇 1 一 92, 那么 有 : 
A.x*B.x+A.y*xB.y 
=(| A| * cos0l) x (|B| * cos02)+(|A| *singl) x (| B| * sin02) 
=| A||B| (cos0l*cos02+t singl * sing2) 
一 |4|| 如 |(cos(61 一 02)) 
=|AI||IB|cos0 
求 4.B 点 积 的 代码 如 下 : 


图 11.3 点 积 的 几何 表示 


double Dot(Vector A, Vector B){return A.x*xB.x+A.y*B.y;} 


2. 点 积 的 应 用 

1) 判断 A 与 B 的 夹 角 是 钝 角 还 是 锐角 

点 积 有 正 负 ,利用 正 负 号 可 以 判断 向 量 的 夹 角 : 
车 dot(4,B) 二 0,4 与 B 的 夹 角 为 锐角 ; 
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若 dot(4,B) 一 0,A4 与 B 的 夹 角 为 钝 角 ; 
若 dot(4,B) 一 0,4 与 B 的 夹 角 为 直角 。 
2) 求 向 量 4 的 长 度 

double Len(Vector A){return sqrt(Dot(A,A));} 
或 者 是 求 长 度 的 平方 ,避免 开 方 运算 : 
double Len2(Vector A){return Dot(A,A);} 

3) 求 向 量 4 与 B 的 夹 角 大 小 


double Angle(Vector A, Vector B){return acos(Dot(A,B)/Len(A)/Len(B));} 


3. 叉 积 (Cross product) 
叉 积 是 比 点 积 更 常用 的 几何 概念 。 它 的 计算 公式 如 下 : 
AXB=|A||B| sing 
9 表示 向 量 4 旋转 到 向 量 B 所 经 过 的 夹 角 。 
两 个 向 量 的 又 积 是 一 个 带 正 负 号 的 数值 。AXB 的 几何 意义 为 向 量 A 和 B 形成 的 平行 
四 边 形 的 “有 向 ?面积 ,这 个 面积 是 有 正 负 的 。 又 积 的 正 负 符 合 * 右 手 定 则 ”, 读 者 可 以 用 
图 11.4 中 的 正 负 情 况 帮助 理解 。 


AXB>0 AXB=AXB'=0 AXB<0 
图 11.4 叉 积 与 又 积 的 正 负 
用 以 下 程序 计算 向 量 A、B 的 又 积 A XB: 
double Cross(Vector A,Vector B){return A.x*B.y 一 A.y*B.x;} 
对 于 其 正确 性 ,读者 可 以 用 前 文 证 明 点 积 的 推导 方法 来 证 明 。 
注意 函数 CrossQ 〇 ) 中 的 A、B 是 有 顺序 的 ,又 积 有 正 负 ,AXB 与 BXA 相反 。 
又 积 有 正 负 , 这 个 性 质 使 得 又 积 能 用 于 很 多 有 用 的 场合 。 
4. 叉 积 的 基本 应 用 
下 面 给 出 叉 积 的 几 个 基本 应 用 。 对 于 其 他 应 用 ,例如 求 两 个 线段 的 方向 关系 、 求 多 边 形 
的 面积 等 ,将 在 后 文 讲 解 。 
1) 判断 向 量 A、B 的 方向 关系 
车 AXB 二 0,B 在 A 的 道 时 针 方 向 ; 
若 4XB<0,B 在 4 的 顺 时 针 方 向 ; 
车 AXB=0,B 与 4 共 线 ,可 能 是 同方 向 的 ,也 可 能 是 反方 向 的 。 


5 


算法 竞赛 入 门 到 进 阶 


2) 计算 两 向 量 构成 的 平行 四 边 形 的 有 向 面积 
3 个 点 4、B.C, 以 4 为 公共 点 ,得 到 两 个 向 量 B 一 A 和 C 一 4, 它 们 构成 的 平行 四 边 形 的 


面积 如 下 : 


Po 


double Area2(Point A,Point B, Point C){return Cross(B—A, C-A);} 


如 果 以 B 或 C 为 公共 点 构成 平行 四 边 形 ,面积 是 相等 的 ,但 是 正 负 不 一 样 。 
3) 计算 3 点 构成 的 三 角形 的 面积 
3 个 点 4.B、C 构成 的 三 角形 的 面积 等 于 平行 四 边 形 面积 Area2(4,B,C) 的 1/2。 
4) 向 量 旋 转 
使 向 量 (z,y) 绕 起 点 逆 时 针 旋 转 , 设 旋转 角度 为 09, 那么 旋转 后 的 向 量 (x ,y ) 如 下 : 
Xx’ = zcosb 一 ysinb 
y = zsinb 十 ycosg 


代码 如 下 ,向 量 4 逆 时 针 旋转 的 角度 为 rad: 


Vector Rotate(Vector A, double rad){ 

return Vector(A.x* cos(rad) ~- A.y* sin(rad), A.x* sin(rad) + A.y* cos(rad)); 
} 
特殊 情况 是 旋转 90 。 
道 时 针 旋 转 90": Rotate(A, pi/2) ,返回 Vector( 一 A.y, A. zz); 
顺 时 针 旋 转 90": Rotate(A, 一 pi/2) ,返回 Vector(A. >, 一 A.z) 。 
有 时 需要 求 单位 法 向 量 , 即 逆 时 针 转 90" ,然后 取 单位 值 。 代 码 如 下 : 


Vector Normal(Vector A){return Vector( - A.y/Len(A), A.x/Len(A));} 
5) 用 又 积 检查 两 个 向 量 是 否 平行 或 重合 


bool Parallel(Vector A, Vector B){return sgn(Cross(A,B)) == 0;} 


1.3 点 和 线 


1. 直线 的 表示 

直线 有 多 种 表示 方法 ,用 户 在 编程 时 可 以 灵活 使 用 这 些 方法 : 

(1) 用 直线 上 的 两 个 点 来 表示 。 

(2) az 十 by 十 c 一 0, 普 通 式 。 

(3) y= 二 kz 十 6b, 斜 截 式 。 

(4) P==Po 十 vt, 点 向 式 。 也 就 是 用 P。 和 wv 来 表示 直线 PP,t 是 变量 ,可 以 取 任 意 值 。 
(Czoyyo) 是 直线 上 的 一 个 点 ; v 是 方向 向 量 , 给 定 两 个 点 A、B, 那 么 v= 二 B 一 A。 

点 向 式 非常 便于 计算 机 处 理 , 也 能 方便 地 表示 射线 线段， 

如 果 :无 限制 ,P 是 直线 ; 

如 果 + 在 [0,1] 内 ,已 是 A、B 之 间 的 线段 ; 

如 果 之 0,P 是 射线 。 


struct Line{ 


= 276“。 


第 11 章 计算 几何 


Point pl, p2; // 线 上 的 两 个 点 
Line(){} 
Line(Point pl, Point p2) :pl1(p1),p2(p2){} 
// 根 据 一 个 点 和 倾斜 角 angle 确定 直线 ,0<angle < pi 
Line(Point p, double angle){ 
pl=p; 
证 (sgn(angle - pi/2) == 0){p2 = (pl + Point(0,1));} 
else{p2 = (pl + Point(1,tan(angle)));} 
} 
//ax+by+c=0 
Line(double a, double b, double c){ 
if(sgn(a) == 0){ 
pl = Point(0, - c/b); 
p2 = Point(1, - c/b); 
} 
else if(sgn(b) == 0){ 
pl = Point( ~ c/a,0); 
p2 = Point( -c/a,1); 


pl = Point(0, - c/b); 
p2 = Point(1,(—-c-a)/b); 


2. 线段 的 表示 

可 以 用 两 个 点 表示 线段 ,起 点 是 p ,终点 是 如。 直接 用 直线 的 数据 结构 定义 线段 : 
typedef Line Segment; 

3. 点 和 直线 的 位 置 关系 


在 二 维 平 面 上 ,点 和 直线 有 3 种 位 置 关系 , 即 点 在 直线 左 侧 、 在 右 侧 、 在 直线 上 。 用 直线 
上 的 两 点 pl 和 ps 与 点 户 构 成 两 个 向 量 , 用 又 积 的 正 负 判 断 方向 ,就 能 得 到 位 置 关系 。 


int Point_line_relation(Point p, Line v){ 
int c = sgn(Cross(p—v.pl,v.p2—v.p1)); 


if(c< 0)return 1; //1: p 在 v 的 左边 
if(c > 0)return 2; //2: p 在 v 的 右边 
return 0; //0: p 在 v 上 


} 


4. 点 和 线段 的 位 置 关系 
判断 点 p 是 否 在 线段 vw 上, 先 用 又 积 判 断 是 否 共 线 , 然后 用 点 积 看 p 和 w 的 两 个 端点 
产生 的 角 是 否 为 钝 角 (实际 上 应 该 是 180° 角 )。 


bool Point_on seg(Point p, Line v){ // 点 和 线段 : 0 为 点 不 在 线段 v 上 ; 1 为 点 在 线段 v 上 
return sgn(Cross(p—v.pl, v.p2—v.p1)) == 0 && sgn(Dot(p - v.pl,p— v.p2)) <=0; 
} 
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5. 点 到 直线 的 距离 

已 知 点 p 和 直线 v(pi .ps). 求 p 到 w 的 距离 。 首 先 用 又 积 求 p、p1、p; 构成 的 平行 四 边 
形 的 面积 ,然后 用 面积 除 以 平行 四 边 形 的 底 边 长 ,也 就 是 线段 (p;， ps) 的 长 度 ,就 得 到 了 平 
行 四 边 形 的 高 , 即 p 点 到 直线 的 距离 。 


double Dis point line(Point p，Line v){ 

return fabs(Cross(p— v.pl,v.p2—v.p1))/Distance(v. pl,v. p2); 
. 
6. 点 在 直线 上 的 投影 


p 已 知 直线 上 的 两 点 pi 、ps 以 及 直线 外 的 一 点 p, 求 投影 
点 po ,如 图 11.5 所 示 。 


Pp Ca 
邻 k=| 如 二 各 | , 即 上 是 线段 加 pr 和 ps pi 长 度 的 比值 。 
pi po |p:—pil 
因为 po 二 pi 十 kx* (ps 一 p1), 如 果 求 得 ,就 能 得 到 po。 
图 11.5 点 线 上 影 
用 人 襄 闪 外 级 上 的 机 根据 点 积 的 概念 ,有 


(p—p)* (ps—p)=| pe—p|l* | 加 一 加 | 
即 |po 一 pi| 二 <2 一 人)“ 《ps 一 2 ,代入 得 


|p:—pi| 
天 | po—p: | (pp— PD papi) 
lps~—Bl lol sbil 
所 以 
po = Pitkx* (ps —p)= p+ es | * (ps — pi) 
代码 如 下 : 


Point Point_ line proj(Point p, Line v){ 
double k=Dot(v.p2—v.pl,p—v.pl)/Len2(v.p2—v.p1); 
return v.pl + (v.p2—v.pl)*k; 

lL 


7. 点 关于 直线 的 对 称 点 
求 一 个 点 p 对 一 条 直线 v 的 镜像 点 。 先 求 点 p 在 直线 上 的 投 
影 9, 青 求 对 称 点 p', 如 图 11.6 所 示 。 


Point Point line symmetry(Point p, Line v){ 
Point q = Point line proj(p,v); 


return Point(2*q.x—-p.x,2x*q.y- p.y); 
} 图 11.6 对 称 点 


8. 点 到 线段 的 距离 


对 于 点 p 到 线段 AB 的 距离 ,在 以 下 3 个 距离 中 取 最 小 值 : 从 p 出 发 对 AB 做 垂 线 , 如 
果 交 点 在 AB 线段 上 ,这 个 距离 就 是 最 小 值 ; p 到 A 的 距离 ; p 到 B 的 距离 。 


double Dis point seg(Point p, Segment v){ 
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if(sgn(Dot(p—v.pl,v.p2—v.p1))<0 || sgn(Dot(p—v.p2,v.pl—v.p2))<0) 
return min(Distance(p,v.p1),Distance(p,v. p2)); 
return Dis point line(p,v); // 点 的 投影 在 线段 上 


} 
9. 两 条 直线 的 位 置 关系 


int Line relation(Line v1, Line v2){ 
if(sgn(Cross(v1.p2— v1.pl,v2.p2— v2.p1)) == 0){ 


if(Point line relation(v1.pl,v2) == 0) return 1; //1: 重 合 
else return 0; //0: 平 行 
} 
return 2; //2: 相 交 


| 


10. 求 两 条 直线 的 交点 

对 于 两 直线 的 交点 ,可 以 通过 aiz bte=0 与 az 十 bzy 十 cz 一 0 联 立 方程 求解 。 不 
过 ,借助 又 各 有 更 简单 的 方法 。 

图 11.7 中 有 4 个 点 A、B.C、D, 组 成 两 条 直线 AB 和 CD ,交点 
是 PP。 以 下 两 个 关系 成 立 : 


IDP| _ Sangp ADxAB a 志 二 二 
[GE|[™ Sa A et Saasp、SAaaac 表示 三 角形 的 


面积 。 


1DP| 项 一 款 3p 一 yp ,其 中 zp ,yp 等 表示 点 的 坐标 。 图 11.7 直线 的 交点 
ICP| zp—ze yp—ye 人 


联 立 上 面 两 个 方程 ,得 到 交点 已 的 坐标 如 下 : 


Saapp 又 Tc 十 SAaBc Xxp 
Xp 
SAaap 十 SAaac 
SAAaBp X yc 十 SAABc X yp 
JP 
SAABD 十 SAaBc 


三 角形 的 面积 可 以 通过 又 积 求 得 : Samp 一 ADXAB,Sansc 一 ABXAC。 
程序 如 下 : 
Point Cross_point(Point a, Point b, Point cv,Point d){ //Linel:ab, Line2:cd 
double sl = Cross(b-a,c—a); 
double s2 = Cross(b-a,d-—a); // 叉 积 有 正 负 
return Point(c.x* s2—d.xx*sl,c.y* s2—d.y* s1)/(s2— s1); 


ji 

注意 : 在 Cross_point() 中 要 对 (s2 一 s1) 做 除法 ,所 以 在 调用 Cross_point() 之 前 应 该 保 
证 s2 一 sS1 天 0, 即 直线 AB、CD 不 共 线 ,而 且 不 平行 。 

11. 判断 两 个 线段 是 否 相 交 

这 里 仍然 利用 叉 积 有 正 负 的 特点 。 如 果 一 条 线段 的 两 端 在 男 一 条 线段 的 两 侧 ,那么 两 
个 端点 与 另 一 线段 产生 的 两 个 又 积 正 负 相反 ,也 就 是 说 两 个 又 积 相 乘 为 负 。 如 果 两 条 线段 
互相 满足 这 一 点 ,那么 就 是 相交 的 。 
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bool Cross_segment(Point a, Point b,Point c,Point d){  //Linel:ab; Line2:cd 
double cl = Cross(b—-a,c—-a),c2=Cross(b-a,d—a); 
double dl = Cross(d—c,a—c),d2=Cross(d-—c,b-—c); 
return sgn(c1) * sgn(c2)<0 && sgn(d1) * sgn(d2)<0; //1: 相 交 ; 0: 不 相交 

} 


12. 求 两 条 线段 的 交点 
先 判断 两 条 线段 是 否 相 交 , 若 相交 ,问题 转化 成 两 条 直线 求 交点 。 


11.1.4 多 边 形 


1. 判断 点 在 多 边 形 内 部 

给 定 一 个 点 P 和 一 个 多 边 形 ,判断 已 是 否 在 多 边 形 内 部 ,有 射线 法 和 转角 法 两 种 方法 。 

射线 法 : 从 P 引 一 条 射线 , 穿 过 多 边 形 , 如 果 和 多 边 形 的 边 相 交 奇 数 次 ,说 明 PP 在 外 
部 ; 如 果 是 偶数 次 ,说 明 在 内 部 。 这 种 方法 比较 烦琐 ,很 少 使 用 。 

转角 法 : 把 点 P 和 多 边 形 的 每 个 点 连接 ,逐个 计算 角度 , 绕 多 边 形 一 周 ,看 多 边 形 相对 
于 这 个 点 总 共 转 了 多 少 度 。 如 果 是 360°, 说 明 点 在 多 边 形 内 ; 如 果 是 0" ,说 明 点 在 多 边 形 
外 ; 如 果 是 180° ,说 明 点 在 多 边 形 边界 上 。 但 是 ,如 果 直 接 算 角 度 , 需 要 计算 反 三 角 函 数 , 不 
仅 速度 慢 , 而 且 有 精度 问题 。 

下 面 的 方法 是 转角 法 思想 的 另 一 种 实现 : 以 点 P 为 起 点 引 一 条 水 平 线 , 检 查 与 多 边 形 
每 条 边 的 相交 情况 ,例如 沿 着 首 时针 ,检查 P 和 每 个 边 的 相交 情况 ,统计 P 穿 过 这 些 边 的 次 
数 。 见 图 11. 8 和 图 11. 9 ,检查 以 下 3 个 参数 ， 

t=CrosastP= j= 


P(xy) *7 = 二 P(xy) "了 Ee 


i(xy) (xy) 


c>0,u<0,w=0 c<0, 1>=0, v<0 
num + 十 mm—— 


图 11.8 PP 在 多 边 形 左 侧 


i(x.y) 


i(x,y) j(xy) 
c>0, u< 0.v>=0 c>0, 150, v<0 
num ++ num 不 变 


图 11.9 P 在 多 边 形 内 部 


= 280“。 


第 11 章 计算 几何 


又 积 c 用 来 检查 P 点 在 线段 去 的 左 侧 还 是 右 侧 ,wv 用 来 检查 经 过 P 的 水 平 线 是 否 穿 
过 线段 唐 。 

用 num 计数 : 

if(c>0 &&u<0 &g&v>=0) numtt+; 

if(c<0 gg u>=0 &&v<0) nom——; 

当 num>0 时 ,P 在 多 边 形 内 部 。 读 者 可 以 验证 其 他 情况 ,例如 PP 在 多 边 形 右 侧 、 多 边 
形 是 止 多 边 形 ,看 上 述 判 断 是 否 成 立 。 

下 面 是 代码 ,注意 多 边 形 的 形状 是 由 各 个 顶点 的 排列 顺序 决定 的 。 


int Point_in_polygon(Point pt, Point *p,int n){ // 点 pt, 多边形 Point *p 
for(int i = 0;i<n;itt){ /1/3: 点 在 多 边 形 的 顶点 上 
if(p[i] == pt)return 3; 
} 
for(int i = 0;i<n;it+){ //2: 点 在 多 边 形 的 边 上 


Line v= Line(p[i],p[(i+1)%n]); 
if(Point_on_seg(pt,v)) return 2; 


} 
int num = 0; 
for(int i = 0;i<n;it+){ 
int j = (i+1)% n; 
int c = sgn(Cross(pt ~ p[j],p[i] ~- p[j])); 
int u = sgn(p[il].y - pt.y); 
int v = sgn(p[j].y - pt.y); 


if(c>0 &g&u<0 &&v>=0) numt+t; 
if(c<0 &g& u>=0 &&v<0) nom——; 
} 
return num != 0; /11: 点 在 内 部 ; 0: 点 在 外 部 
} 


2. 求 多 边 形 的 面积 

给 定 一 个 凸 多 边 形 , 求 它 的 面积 。 读 者 很 容易 想到 ,可 以 在 凸 多 边 形 内 部 找 一 个 点 P， 
然后 以 这 个 点 为 中 心 ,与 凸 多 边 形 的 边 结合 ,对 多 边 形 进行 三 角 剖 分 ,所 有 三 角形 的 和 就 是 
凸 多 边 形 的 面积 。 每 个 三 角形 的 面积 可 以 用 又 积 来 求 。 

事实 上 ,上 述 方法 不 仅 可 用 于 凸 多 边 形 ,也 适用 于 非 凸 多 边 形 ; 而 且 点 已 并 不 需要 在 多 
边 形 内 部 ,在 任何 位 置 都 可 以 ,例如 以 原点 为 已 ,编程 最 简单 。 这 是 因为 又 积 是 有 正 负 的 , 它 
可 以 抵消 多 边 形 外 部 的 面积 ,图 11. 10 给 出 了 各 种 情况 。 


图 11.10 求 任意 多 边 形 的 面积 
下 面 的 程序 以 原点 为 中 心 点 划分 三 角形 ,然后 求 多 边 形 的 面积 。 
double Polygon area(Point *p, int n){ //Point x*p 表示 多 边 形 


double area = 0; 
"ls 
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for(int i = 0;i<n;it+) 
area += Cross(p[il],p[(i+1)%n]); 


return area/2; // 面 积 有 正 负 ,这 里 不 能 简单 地 取 绝 对 值 


} 
3. 求 多 边 形 的 重心 


将 多 边 形 三 角 放 分 ,算出 每 个 三 角形 的 重心 ,三 角形 的 重心 是 3 点 坐标 的 平均 值 ,然后 


对 每 个 三 角形 的 有 向 面积 求 加 权 平均 。 


下 面 用 一 个 例题 综合 讲解 前 面 一 些 模板 的 应 用 。 代 码 中 的 Polygon_center() 是 求 多 边 


形 的 重心 。 


hdu 1115“Lifting the Stone” 
给 定 一 个 N 多 边 形 ,3 三 N 二 1 000 000, 求 重心 。 


代码 如 下 : 


# include <bits/stdc++.h> 
struct Point{ 
double x, y; 
Point(double X=0,double Y=0){x=X,y=Y;} 
Point operator + (Point B){return Point (x+B.x,y+B.y);} 
Point operator — (Point B){return Point (x- B.x,y- B.y);} 
Point operator * (double k){return Point (x*k,y*k);} 
Point operator / (double k){return Point (x/k, y/k);} 
}; 
typedef Point Vector; 
double Cross(Vector A,Vector B){return A.x*B.y — A.y*B.x;} 
double Polygon area(Point *p, int n){ // 求 多 边 形 的 面积 
double area = 0; 
for(int i = 0;i<n;it+) 
area += Cross(p[i],p[(i+1)%n]); 
return area/2; // 面 积 有 正 负 ,不 能 取 绝 对 值 
} 
Point Polygon_center(Point *p, int n){ // 求 多 边 形 的 重心 
Point ans(0,0); 
if(Polygon area(p,n) == 0) return ans; 
for(int i = 0;i<n;it+) 
ans = ans+(p[i] +p[(i+1)%n])*Cross(p[i],p[(i+1)%n]); 
return ans/Polygon area(p,n)/6; 
有 
int main(){ 
int t,n, i; 
Point center; // 重 心 的 坐标 
Point p[100000]; 
Scanf(" %d",&t); 
while(t—— ){ 
scanf(" %d", gn); 
for(i=0;i<n;it+) scanf("%1f %1f",g&p[i].x,gp[i].y); 
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center = Polygon center(p,n); 
printf(" % .2f $% .2f\n",center.x,center.Y); // 注 意 这 里 输出 用 %f, 不 是 用 %1f 
} 


return 0; 


【习题 】 
hdu 1558, 几 何 十 并 查 集 。 
和 诈 :.1.5 冰 包 


西 包 (Convex hulD) 是 计算 几何 中 的 著名 问题 ,有 非常 广泛 的 应 用 ? 

凸 包 问 题 : 给 定 一 些 点 , 求 能 把 所 有 这 些 点 包含 在 内 的 面积 最 小 的 多 边 形 。 可 以 想象 
有 一 个 很 大 的 橡皮 夭 , 它 把 所 有 的 点 都 籍 在 里 面 , 在 橡皮 短 收 紧 之 后 , 绕 着 最 外 围 的 点 形成 
的 多 边 形 就 是 凸 包 。 

求 凸 包 的 常用 算法 有 两 种 ,一 是 Graham 扫描 法 ,其 复杂 度 是 O(nlogsn); 二 是 Jarvis 
步 进 法 ,其 复杂 度 是 O(nh) ,六 是 凸 包 上 的 顶点 数 。 这 两 种 算法 的 基本 思路 是 “旋转 扫除 ”， 
设 定 一 个 参照 顶点 ,逐个 旋转 到 其 他 所 有 顶点 ,并 判断 这 些 顶 点 是 否 在 凸 包 上 。 

这 里 介绍 Graham 扫描 法 的 变种 一 一 Andrew 算法 , 它 更 快 、 更 稳定 。 算 法 做 两 次 扫描 ， 
先 从 最 左边 的 点 沿 “ 下 凸 包 ”扫描 到 最 右边 ,再 从 最 右边 的 点 沿 "“ 上 凸 包 ”扫描 到 最 左边 ,“ 上 
凸 包 ? 和 “下 凸 包 ? 合 起 来 就 是 完整 的 凸 包 。 

具体 步骤 如 下 : 

(1) 把 所 有 点 按照 横 坐 标 x 从 小 到 大 进行 排序 ,如 果 zx 相同 , 按 y 从 小 到 大 排序 ,并 删 
除 重复 的 点 ,得 到 序列 {po ,pi ,ps，… ,pn)。 

C2) 0 po 一 定 在 凸 包 上 , 它 是 凸 包 最 左边 的 顶点 ,从 
po 开始 ,依次 检查 {pi ,ps，… ) ,扩展 出 “下 凸 包 ”。 判 断 的 依据 是 : 如 果 新 点 在 凸 包 “ 前 
进 ? 方 向 的 左边 ,说 明 在 ” er 把 它 加 入 到 凸 包 ; 如 果 在 右边 ,说 明 拐弯 了 ,删除 最 
近 加 入 下 凸 包 的 点 。 继 续 这 个 过 程 , 直 到 检查 完 所 有 点 。 拐 弯 方 向 用 又 积 判断 即 可 。 例 
如 图 11. 11 所 示 ,在 检查 ps 时 发 现 p, ps 对 psps 是 右 拐 弯 的 ,说 明 ps 不 在 下 凸 包 上 (有 
可 能 在 “上 凸 包 ”上 ,在 步骤 (3) 中 会 判断 ); 退回 到 户 ,发 现 psps 对 pspi 也 是 右 拐 弯 的 
退回 到 户 。 


| 
Nn 
已 


图 11.11 下 凸 包 


@ https://en. wikipedia. org/ wiki/Convex_hull。 
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(3) 从 右 到 左 重 新 扫描 所 有 点 , 求 *Y 上 凸 包 ”。 和 求 “ 下 凸 包 ”的 过 程 类 似 ,最 右边 的 点 
pm 一 定 在 凸 包 上 。 

复杂 度 。 算 法 先 对 点 排序 ,复杂 度 是 O(nlogsn)?, 然 后 扫描 O(Cz) 次 得 到 凸 包 。 算 法 的 
总 复杂 度 是 O(nlogzn)。 

下 面 用 一 个 例题 讲解 凸 包 模板 的 应 用 。 代 码 中 的 Convex_hull() 是 求 凸 包 ,注意 其 中 
用 于 去 重 的 unique() 函 数 。 


hdu 1392 “Surround the Trees” 
输入 mn 个 点 , 求 凸 包 的 周 长 。 


代码 如 下 : 


# include < bits/stdc++.h> 
using namespace std; 
const int maxn = 104; 
const double eps = le—8; 
int sgn(double x){ // 判 断 x 是否 等 于 0 
if(fabs(x) <eps) return 0; 
else return x<0? 一 1:1; 
J 
struct Point{ 
double x, y; 
Point(){} 
Point(double x, double y):x(x),y(Y){} 
Point operator + (Point B){return Point(x+B.x,y+B.y);} 
Point operator — (Point B){return Point(x- B.x,y- B.y);} 
bool operator == (Point B){return sgn(x—B.x) == 0 && sgn(y-B.Y) == 0;} 
bool operator < (Point B){ // 用 于 sort() 排 序 
return sgn(x—B.x)<0 || (sgn(x-B.x)==0 && sgn(y- B.y)<0);} 
}; 
typedef Point Vector; 
double Cross(Vector A, Vector B){return A.x*B.y - A.y*B.x;} // 叉 积 
double Distance(Point A,Point B){return hypot(A.x—B.x,A.y— B.y);} 
//Convex_hull1( ) 求 凸 包 . 凸 包 顶 点 放 在 ch 中 ,返回 值 是 凸 包 的 顶点 数 
int Convex_ hull(Point * p, int n,Point x*ch){ 


sort(p,p+n); // 对 点 排序 : 按 x 从 小 到 大 排序 ,如 果 x 相同 , 按 y 排 序 
n= unique(p, p+n)-p; // 去 除 重复 点 
int v= 0; 


// 求 下 凸 包 .如 果 p[ 订 是 右 拐弯 的 ,这 个 点 不 在 凸 包 上 , 往 回 退 
for(int i=0;i<n;it+){ 
while(v>1 && sgn(Cross(ch[v—-1] -ch[lv- 2],p[i] -ch[v- 2]))<=0) 
二 
ch[v++] = pli]; 
} 


int j=v; 


@ 证 明 见 (计算 几何 算法 与 应 用 (第 3 版 )),Mark de Berg 等 著 , 邓 俊 辉 译 , 清 华 大 学 出 版 社 ,8 页 。 
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// 求 上 凸 包 
for(int i=n-2;i>=0;i-—){ 
while(v> j && sgn(Cross(ch[v-1]-ch[v-2],p[i]-ch[v-2]))<=0) 
ch[v++]=p[i]; 
} 
(== 
return v; // 返 回 值 v 是 凸 包 的 顶点 数 
} 
int main(){ 
int n; 
Point p[maxn], ch[ maxn]; // 输 入 点 是 p[ ], 凸 包 顶 点 放 在 ch[ ] 中 
while(scanf("%d",gn) && n){ 
for(int i=0;i<n;it+) scanf("% 1f%1f",gp[i].x,&p[i].y); 
int v = Convex hull(p,n,ch); // 返 回 凸 包 的 顶点 数 v 
double ans = 0; 
if(v==1) ans= 0; 
else if(v==2) ans = Distance(ch[0],ch[1]); 
else 
for(int i=0;i<v;it+) // 计 算 凸 包 的 周 长 
ans += Distance(ch[i],ch[ (i+1)%v]); 
printf(" % .2f\n",ans); 
} 


return 0; 


【习题 】 
hdu 6325 “Interstellar Travel”。 
11.1.6 最 近 点 对 


平面 最 近 点 对 问题 : 给 定 平面 上 的 个 点 , 找 出 距离 最 近 的 两 个 点 。 

先 考 虑 暴力 法 , 即 列 出 所 有 的 点 对 ,然后 比较 每 一 对 的 距离 , 找 出 其 中 最 短 的 。n 个 点 
有 c(n,2) 种 组 合 ,复杂 度 是 OCG? ) 。 

最 近 点 对 的 标准 算法 是 分 治 法 ,复杂 度 是 O(nlogsn)。 下 面 是 思路 : 

划分 。 把 点 的 集合 S 平均 分 成 两 个 子 集 S, 和 S;( 按 点 的 zx 坐标 排序 ,并 按 xz 的 大 小 分 
成 两 半 ) ,然后 每 个 子 集 再 划分 成 更 小 的 两 个 子 集 ,递归 这 个 过 程 ,直到 子 集中 只 有 一 个 点 或 
两 个 点 。 

解决 。 在 每 个 子 集中 递归 地 求 最 近 点 对 。 

合并 。 在 求 出 子 集 S, 和 S; 的 最 接近 点 对 后 ,合并 S, 和 S: 。 合 并 时 有 以 下 两 种 情况 : 

(1) 集合 S 中 的 最 近 点 对 在 子 集 S, 内 部 或 者 S。 内 部 ,那么 可 以 简单 地 直接 合并 S, 和 
Sh 

(2) 这 两 个 点 一 个 在 S, 中 ,一 个 在 S; 中 ,不 能 简单 合并 。 设 S, 中 的 最 短 距 离 是 di ,S。 
中 的 最 短 距离 是 d ,在 S; 和 S; 的 中 间 点 pLmidj] 附 近 找 到 所 有 离 它 小 于 di 和 d; 的 点 ( 仍 
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然 按 z 坐标 值 计算 距离 ) ,记录 在 点 集 tmp_p[] 中 ,这 样 
那么 最 近 点 对 就 在 这 些 点 中 。 这 样 在 这 些 点 中 找 最 近 
点 对 就 行 了 。 用 分 治 法 求 最 近 点 对 应 如 图 11. 12 所 示 。 
但 是 ,仍然 不 能 直接 用 暴力 法 列 出 点 集 tmp_p[] 中 的 所 
有 点 对 ,否则 会 TLE。 可 以 先 按 y 坐标 值 对 tmp_p[] 
的 点 排序 (这 次 不 能 按 x 坐标 值 排序 ,请 思考 为 什么 )， 
然后 用 剪 枝 把 不 符合 条 件 的 去 掉 。 具 体 见 下 面 例题 的 


代码 。 
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dd | 由 


11.12 用 分 治 法 求 最 近 点 对 


hdu 1007 “Quoit Design” 


给 定 平面 上 的 nn 个 点 ,2 二 n 坟 100 000。 


找到 最 近 点 对 ,输出 最 近 点 对 距离 的 一 半 。 


下 面 是 代码 ,注意 其 中 分 治 法 和 剪 枝 的 内 容 。 程 序 比 较 简 单 , 读 者 应 该 能 自己 写 出 来 。 


# 


include <bits/stdc++.h> 


using namespace std; 
const double eps = le—8; 
const int MAXN = 100010; 
const double INF = le20; 
int sgn(double x){ 


} 


if(fabs(x) < eps) 
else return x<0?—-—1:1; 


return 0; 


struct Point{ 


}; 


double x,y; 


double Distance(Point A, Point B){return hypot(A.x—B.x,A.y— B.y);} 
bool cmpxy(Point A, Point B){ 
return sgn(A.x—B.x)<0 || (sgn(A.x—B.x) ==0 && sgn(A.y— B.y)<0); 


} 


// 排 序 : 先 对 横 坐 标 x 排序 ,再 对 y 排 序 


bool cmpy(Point A, Point B){return sgn(A.y- B.y)<0;} // 只 对 y 坐标 排 序 
Point p[ MAXN], tmp_p[ MAXN]; 
double Closest_ Pair(int left, int right){ 
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double dis = INF; 
if(left == right) return dis; 
if(left + 1 == right) 
return Distance(p[left], p[right]); 
int mid = (left+ right)/2; 
double dl = Closest Pair(left,mid); 
double d2 = Closest Pair(mid+1,right); 
dis = min(dl,d2); 
intk = 0; 
for(int i= left;i<= right;i++) 
if(fabs(p[mid].x - p[i].x) <=dis) 
tmp_p[k++] = p[il]; 
sort(tmp p,tmp p+k,cmpy); 


// 只 剩 一 个 点 
// 只 剩 两 个 点 


// 分 治 
// 求 sl 内 的 最 近 点 对 
// 求 s2 内 的 最 近 点 对 


// 在 sl 和 s2 中 间 附 近 找 可 能 的 最 小 点 对 
// 按 x 坐标 来 找 


// 按 Y 坐 标 排序 ,用 于 剪 枝 .这 里 不 能 按 x 坐标 排序 
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for(int i=0;i<k;it++) 
for(int j=i+1;j<k;j++){ 
if(tmp_p[j].y - tmp_p[i].y>=dis) break;  // 剪 枝 
dis = min(dis,Distance(tmp_p[i], tmp_p[j])); 
} 
return dis; // 返 回 最 小 距离 
} 
int main(){ 
int n; 
while(~scanf("%d",g&n) && n){ 
for(int i=0;i<n;it++) scanf("% 1f$%1f",g&p[i].x,&p[i].y); 


sort(p,p+n,cmpxy); // 先 排序 
printf(" % .2f\n",Closest_Pair(0,n— 1)/2); // 输 出 最 短 距离 的 一 半 
} 
return 0; 
上 
【习题 】 


hdu 5721 “Palace”。 
11.1.7 旋转 卡 过 


对 于 平面 上 的 点 集 ,可 以 用 两 条 或 更 多 平行 线 来 “ 卡 ” 住 它们 ,从 而 解决 很 多 问题 。 
图 11. 13 给 出 了 一 些 应 用 场合 。 


\ as 
\B \ 
\ 
x 2 洲 
~、、 
A 
N AU- 
(a) 凸 包 最 大 距离 点 对 (b) 凸 包 最 短 距 离 点 对 (©) 最 小 面积 外 接 和 矩形 (d) 最 小 周 长 外 接 和 矩形 
AN ,| 
\、 1 
S | 
1 
(e®) 凸 包间 的 最 大 距离 (1 凸 包间 的 最 小 距离 


图 11.13 旋转 卡 壳 的 应 用 


两 条 平行 线 与 凸 包 的 交点 称 为 对 中 点 对 (antipodal pair) ,例如 图 11.13(a) 中 的 A、B 
点 。 找 对 哑 点 对 ,可 以 使 用 被 形象 地 称 为 旋转 卡 壳 (rotating calipers) 的 方法 。 

旋转 卡 壳 算法 是 这 样 操作 的 : 

(1) 找 初始 的 对 中 点 对 和 平行 线 。 可 以 取 y 坐标 最 大 和 最 小 的 两 个 点 ,经 过 这 两 个 点 
做 两 条 水 平 线 , 一 条 向 左 , 一 条 向 右 。 
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(2) 同时 逆 时 针 旋转 两 条 线 , 直 到 其 中 一 条 线 与 多 边 形 的 一 条 边 重合 。 此 时 得 到 新 的 
对 中 点 对 。 如 果 题目 要 求 最 大 距离 点 对 ,可 以 计算 新 对 中 点 对 的 距离 ,并 比较 和 更 新 。 
(3) 重复 (2) ,直到 回 到 初始 对 是 点 。 


【习题 】 


hdu 2202, 凸 包 十 旋转 卡 壳 。 
hdu 2187/2823。 
hdu 5251, 凸 包 十 旋转 卡 壳 求 最 小 矩形 覆盖 。 


11.1.8 半 平 面 交 


半 平 面 就 是 平面 的 一 半 。 

一 个 半 平 面 用 一 条 有 向 直线 来 定义 。 一 条 直线 把 平面 分 成 两 部 分 ,为 区 分 这 两 部 分 ,这 
条 直线 应 该 是 有 向 的 ,可 以 定义 它 左 侧 的 平面 是 它 代 表 的 半 平 面 。 

给 定 一 些 半 平面 ,它们 相交 会 围 成 一 片区 域 ,例如 图 11. 14 所 示 的 情况 。 


(a) 围 成 一 个 凸 多 边 形 (b) 新 的 凸 多 边 形 (c) 不 闭合 的 情况 
图 11.14 半 平 面 交 


图 11.14(a) 中 的 5 个 半 平 面 围 成 了 一 个 凸 多 边 形 。 如 果 再 添加 一 个 穿 过 凸 多 边 形 的 
半 平 面 ,那么 凸 多 边 形 会 变 成 图 11. 14(b) 。 半 平面 交 也 可 能 不 会 闭合 成 一 个 凸 多 边 形 ,而 
是 成 为 图 11. 14(c) 的 无 边界 的 情况 。 在 编程 时 为 方便 处 理 ,可 以 在 合适 的 地 方 人 为 添加 半 
平面 ,闭合 为 凸 多 边 形 。 

半 平 面 的 交 一 定 是 凸 多 边 形 (可 能 不 闭合 ) ,所 以 求解 半 平 面 交 间 题 就 是 求解 形成 的 凸 
多 边 形 。 

1. 半 和 平面 的 定义 

表示 半 平 面 的 有 向 直线 ,定义 如 下 : 


struct Line{ 


Point p; // 直 线 上 的 一 个 点 

Vector v; // 方 向 向 量 , 它 的 左边 是 半 平 面 
double ang; // 极 角 , 从 x 正 半 轴 旋 转 到 v 的 角度 
Line(){}; 


Line(Point p, Vector v):p(p),v(v){ang = atan2(v.y, v.x);} 
bool operator < (Line &L){return ang < L.ang;} // 用 于 排序 
}; 


2. 半 平 面 交 算法 
半 平 面 交 有 一 个 显而易见 的 算法 , 即 增 量 法 ,描述 如 下 : 
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(1) 初始 凸 包 。 先 人 为 设 定 一 个 极 大 的 矩形 ,作为 初始 凸 多 边 形 , 它 能 把 最 后 形成 的 凸 
多 边 形 包含 进来 。 

(2) 逐一 添加 半 平 面 ,更 新 凸 多 边 形 。 例 如 添加 半 平 面 民 ,如 果 它 能 切割 当前 的 凸 多 边 
形 , 则 保留 K 左边 的 点 ,删除 它 右边 的 点 ,并 把 K 与 原 凸 多 边 形 的 交点 加 入 到 新 的 凸 多 边 
形 中 。 

增 量 法 不 太 好 , 它 的 复杂 度 是 Ol), 即 一 共有 nn 次 切割 ,每 次 切割 都 是 O(n) 的 。 在 下 
一 页 的 例题 hdu 2297 中 ,0 二 n 志 50 000, 用 增 量 法 会 TLE。 

下 面 介 绍 的 算法 ,其 复杂 度 为 O(nlogzn)。 

思考 半 平 面 交 最 终 形成 的 凸 多 边 形 , 沿 逆 时 针 顺 序 看 , 它 的 边 的 极 角 ( 或 者 斜率 ) 是 单调 
递增 的 。 那 么 ,可 以 先 按 极 角 递 增 的 顺序 对 半 平 面 进 行 排序 ,然后 逐个 进行 半 平 面 交 ,最 后 
就 得 到 了 凸 多 边 形 。 在 这 个 过 程 中 ,用 一 个 双 端 队列 记录 构成 凸 多 边 形 的 半 平 面 : 队列 的 
首部 指向 最 早 加 入 凸 多 边 形 的 半 平 面 ,尾部 指向 新 加 入 的 半 平 面 。 

算法 的 具体 步骤 如 下 : 

(1) 对 所 有 半 平 面 按 极 角 排序 。 

(2) 初始 时 ,加 入 第 1 个 半 平 面 , 双 端 队列 的 首部 和 尾部 都 指向 它 。 

(3) 逐个 加 入 和 处 理 半 平面 。 图 11. 15 演示 了 基本 情况 ,原来 半 平 面具 有 1 和 2, 加 入 
半 平 面 3。 注 意 , 由 于 半 平 面 已 经 排序 ,3 的 极 角 比 1.2 大 ,所 以 有 图 11. 15 所 示 的 4 种 情况 。 


图 11.15 在 半 平 面 1 和 2 上 加 入 半 平 面 3 的 4 种 情况 


如 果 当 前 双 端 队列 中 不 止 有 两 个 半 平 面 , 可 以 根据 上 面 的 讨论 进行 扩展 。 例 如 当前 处 
理 到 半 平 面 L;, 有 4 种 情况 : Li 可 以 直接 加 入 队列 ; L; 覆盖 了 原 队 尾 ; L; 覆盖 了 原 队 首 ; 
L; 不 能 加 入 到 队列 。 下 面 讨论 后 面 3 种 情况 。 

情况 1: L; 覆盖 原 队 尾 。 操 作 是 : while 队 尾 的 两 个 半 平 面 的 交点 在 L; 外 面 ,那么 删除 
队 尾 半 平 面 。 例 如 在 图 11.16(a) 中 , 队 尾 的 两 个 半 平 面 L; 、L; 的 交点 是 &。 图 (b) 中 新 加 入 
半 平 面 L,, 因 为 k 在 L, 的 外 面 ( 点 在 有 向 直线 L, 的 右边 ) ,删除 队 尾 的 半 平 面 L;。 


(a) 队 尾 的 半 平 面 交 点 (b)k 在 ZL 的 外 面 ， 删 除 L， 
图 11.16 处 理 队 尾 


情况 2: L; 覆盖 原 队 首 。 操 作 是 : while 队 首 的 两 个 半 平 面 的 交点 在 志 外 面 ,那么 删除 
队 首 的 半 平 面 。 例 如 在 图 11. 17(a) 中 , 队 首 Li 、Ls 的 两 个 半 平 面 的 交点 是 >, 图 (b) 中 新 加 
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入 半 平 面 L; ,因为 x 在 Ls 的 外 面 ,删除 队 首 的 半 平 面 Li 。 


(a) 队 首 半 的 平面 交点 z (b) :在 的 外 面 ， 删 除 己 
11.17 处 理 队 首 


情况 3: L; 不 能 加 入 到 队列 。 例 如 图 11. 18 所 示 的 半 平 
面 L; ,在 步骤 (3) 中 是 合法 的 ,但 是 它 其 实 是 无 用 的 ,不 能 加 入 
到 队列 。 判 断 条 件 是 : 尾部 L, 、Ls 的 交点 7 在 首部 Li 的 外 
面 , 则 删除 Ls 。 

上 述 步 又 的 代码 实现 见 下 面 的 例题 。 

复杂 度 分 析 。 排 序 ,复杂 度 是 OCzlog:z); 逐个 加 入 半 平 
面 , 共 检查 O(n) 次 , 所 以 总 复杂 度 是 O(nlogsn)。 Et 

3. 半 平 面 的 应 用 

下 面 的 题目 是 很 好 的 例子 , 它 是 半 平 面 交 的 一 个 应 用 场景 。 


hdu 2297 “Run” 
nn 个 人 (0 二 n 三 50 000) 在 一 条 笔直 的 路 上 跑马 拉 松 。 设 初始 时 每 个 人 处 于 不 同 的 
位 置 ,然后 每 个 人 都 以 自己 的 恒定 速度 不 停 地 往 前 跑 。 
给 定 这 n 个 人 的 初始 位 置 和 速度 , 问 有 多 少 人 可 能 在 某 时 刻 成 为 第 一 ? 


读者 可 以 先 思 考 : 这 一 题 如 何 建 模 为 平面 几何 的 半 平 面 问题 ? 

这 一 题 实际 上 是 半 平 面 交 的 裸 题 , 下 面 是 建 模 过 程 。 

以 时 间 上 为 横 轴 ,距离 * 为 纵 轴 。 设 某 人 的 初始 位 置 在 A 点 ,从 A 出 发 画 一 条 直线 。 他 
在 某 个 时 间 段 At 内 经 过 距离 As, 两 者 的 比值 是 直线 的 斜率 ,其 物理 意义 正好 是 速度 。 他 在 
某 时 刻 志 的 位 置 就 是 他 在 这 条 直线 上 的 纵 坐 标 。 这 条 直线 代表 了 他 的 运动 轨迹 。 运 动 轨 
迹 始终 位 于 第 一 象限 。 

图 11. 19(a) 中 的 两 条 直线 是 两 个 人 A 和 B 的 运动 轨迹 ,交叉 点 上 是 B 妃 上 A 的 点 。 

如 果 有 nn 个 人 ,那么 就 有 n 条 直线 在 第 一 象限 , 见 图 (b)。 相 交 的 点 是 追 上 的 点 ,但 妃 上 
后 不 一 定 排 第 一 ,例如 图 中 的 线 1, 它 与 其 他 线 有 两 个 交点 .但 都 不 是 第 一 。 只 有 同 面 上 的 
点 才 是 题目 要 求 的 排名 第 一 的 点 。 另 外 ,由 于 这 些 直线 的 半 平 面 交 不 是 一 个 完整 的 凸 多 边 
形 ,为 方便 编程 ,可 以 加 两 个 半 平 面 已 和 下 ,形成 闭合 的 凸 多 边 形 ,其 中 已 是 > 值 无 穷 大 的 
向 左 的 水 平 线 ,F 是 反 向 的 y 轴 。 图 中 阴影 是 半 平 面 交 形 成 的 凸 多 边 形 , 凸 多 边 形 的 顶点 数 
量 去 掉 最 上 面 的 两 个 黑 点 ,就 是 题目 要 求 的 排 过 第 一 名 的 数量 。 
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(a) 3 追赶 4 (b) 半 平 面 交 


图 11.19 追赶 问题 
下 面 是 hdu 2297 的 代码 2。 


# include < bits/stdc++.h> 
using namespace std; 
const double INF = lel2; 
const double pi = acos( -1.0); 
const double eps = le 一 8; 
int sgn(double x){ 
if(fabs(x) < eps) return 0; 
else return x<0? 一 1:1; 
struct Point{ 
double x,y; 
Point(){} 
Point(double x, double y) :x(x),y(y){} 
Point operator + (Point B){return Point(x+B.x,y+B.y);} 
Point operator — (Point B){return Point(x- B.x,y- B.y);} 
Point operator * (double k){return Point(x*k,y*k);} 
}; 
typedef Point Vector; 
double Cross(Vector A, Vector B){return A.x*B.y — A.y*B.x;} // 叉 积 
struct Line{ 
Point p; 
Vector v; 
double ang; 
Line(){}; 
Line(Point p, Vector v) :p(p),v(v){ang = atan2(v.y,v.x);} 
bool operator < (Line &L){return ang<L.ang;} // 用 于 极 角 排 序 
}; 
// 点 p 在 线 工 的 左边 , 即 点 p 在 线 工 的 外 面 
bool OnLeft(Line L, Point p){return sgn(Cross(L.v,p—L.p))>0;} 
Point Cross_point (Line a, Line b){ // 两 直线 的 交点 
Vector u=a.p 一 b.p; 
doublet= Cross(b.v,u)/Cross(a.v,b.v); 
returna.pta.v*t; 


@ 其 中 HPIO 的 代码 改编 自 (算法 竞赛 入 门 经 典 训练 指南 》, 刘 汝 佳 \ 陈 锋 著 , 清 华 大 学 出 版 社 ,278 页 。 
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vector<Point > HPI(vector <Line> L){ // 求 半 平 面 交 ,返回 凸 多 边 形 
int n=L. size(); 
sort(L. begin(),L. end()); // 将 所 有 半 平 面 按照 极 角 排 序 
int first, last; // 指 向 双 端 队列 的 第 一 个 和 最 后 一 个 元 素 
vector < Point > p(n); // 两 个 相 邻 半 平面 的 交点 
vector <Line> q(n); // 双 端 队列 
vector < Point > ans; // 半 平面 交 形 成 的 凸 包 


qlfirst = last=0]=L[0]; 
for(int i=1;i<n;it+){ 
// 情 况 1: 删除 尾部 的 半 平 面 
while(first < last && !OnLeft(L[i], p[last—1])) last —-; 
// 情 况 2: 删除 首部 的 半 平 面 
while(first < last && !OnLeft(L[i], p[first])) first++; 


ql++last] =L[i]; // 将 当前 的 半 平 面 加 入 双 端 队列 的 尾部 
// 极 角 相 同 的 两 个 半 平 面 保 留 左边 
if(fabs(Cross(q[last].v,q[llast—1].v)) < eps){ 

last ——; 


if(OnLeft(qg[last],L[i].p)) allast] =L[i]; 
} 
// 计 算 队 列 尾部 的 半 平 面 交点 
if(first< last) p[last -1] =Cross point(gq[last -1],q[llast]); 
} 
// 情 况 3: 删除 队列 尾部 的 无 用 半 平 面 
while(first < last && !OnLeft(q[first],p[last—1])) last ——; 
if(last- first<=1) return ans; // 空 集 
p[last] = Cross_point(q[last],q[lfirst]);  // 计 算 队 列 首尾 部 的 交点 
for(int i=first;i<= last;i++) ans.push_back(p[i]); // 复 制 
return ans; // 返 回 凸 多 边 形 
} 
int main(){ 
int T,n; 
cin>>T; 
while(T-—— ){ 
cin>>n; 
Vector<Line> L; 
// 加 一 个 半 平 面 F: 反 向 Y 轴 
L.push back(Line(Point(0,0),Vector(0, -1))); 
// 加 一 个 半 平 面 E:y 极 大 的 向 左 的 直线 
L.push back(Line(Point(0, INF), Vector( -1,0))); 
while(n—— ){ 
double a,b; 
scanf("% 1f%1f",&a, gb); 
L. push back(Line(Point(0,a), Vector(1,b))); 
} 


vector < Point > ans = HPI(L); // 得 到 是 多边形 
printf(" % d\n",ans. size() -2); // 去 掉 人 为 加 的 两 个 点 
} 
return 0; 
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【习题 】 


hdu 4316, 凸 包 十 半 平 面 交 。 
hdu 3982, 半 平面 交 。 


11.2 加 


11.2.1 基本 计算 


1. 圆 的 定义 
用 圆心 和 半径 表示 圆 。 


struct Circle{ 
Point c; // 圆 心 
double r; // 半 径 
Circle(){} 
Circle(Point c, double r) :c®, r®!{} 
Circle(double x, double y, double _r){c= Point(x,y);r = _r;} 
}; 


点 和 圆 的 关系 根据 点 到 圆心 的 距离 判断 。 


int Point_circle_relation(Point p, Circle C){ 
double dst = Distance(p,C.c); 


if(sgn(dst - C.r) <0) return 0; /10: 点 在 圆 内 
if(sgn(dst - C.r) ==0) return 1; /11: 点 在 圆 上 
return 2; //2: 点 在 圆 外 


3. 直线 和 圆 的 关系 
直线 和 圆 的 关系 根据 圆心 到 直线 的 距离 判断 。 


int Line circle relation(Line v,Circle C){ 
double dst = Dis point line(C.c,v); 


if(sgn(dst — C.r) < 0) return 0; //0: 直线 和 圆 相交 
if(sgn(dst— C.r) ==0) return 1; //1: 直线 和 圆 相 切 
return 2; //2: 直线 在 圆 外 


4. 线段 和 圆 的 关系 
线段 和 圆 的 关系 根据 圆心 到 线段 的 距离 判断 。 


int Seg_circle_relation(Segment vv Circle C){ 
double dst = Dis point seg(C.c,v); 
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if(sgn(dst— C.r) < 0) return 0; //0: 线段 在 圆 内 
if(sgn(dst— C.r) ==0) return 1; 
return 2; 
} 
5. 直线 和 圆 的 交点 po 2 


求 直线 和 圆 的 交点 可 以 按 图 11. 20 所 示 , 先 求 圆心 c 在 直线 名 
上 的 投影 g, 青 求 距离 d, 然 后 根据 + 和 d 求 出 长 度 &, 最 后 求 出 
两 个 交点 ps。 二 gq 十 n * 尺 ps 一 gq 一 nx*k, 其 中 是 直线 的 单位 
向 量 。 

//pa、pb 是 交点 .返回 值 是 交点 的 个 数 图 11. 20 直线 和 圆 的 交点 


int Line_cross_circle(Line v Circle C,Point gpa, Point &pb){ 
if(Line_circle_relation(v，C) ==2) return 0; ” // 无 交点 


Point q = Point line proj(C.c,v); // 圆 心 在 直线 上 的 投影 点 
double d = Dis point line(C.c,v); // 圆 心 到 直线 的 距离 
double k = sqrt(C.r*C.r-d*xd); 
if(sgn(k) == 0){ // 一 个 交点 ,直线 和 圆 相 切 
pa = qipb = q;return 1; 

} 
Point n= (v.p2—v.p1)/ Len(v.p2—v.p1); // 单 位 向 量 
pa=qtnx*k; phb=q- nx*k; 
return 2; // 两 个 交点 

6. 模板 的 使 用 


下 面 用 hdu 5572 题 演示 点 、 线 、 圆 的 几何 模板 的 使 用 ,如 图 11. 21 所 示 。 这 一 题 出 自 
2015 年 ACM-ICPC 区 域 赛 上 海 赛区 的 现场 赛 ,题目 的 详细 说 明 见 12.2.4 节 。 


hdu 5572 “An Easy Physics Problem” 
在 一 个 无 限 光 滑 的 桌面 上 有 一 个 固定 的 大 圆柱 体 , 还 有 一 个 体积 忽略 不 计 的 小 球 。 
开始 时 球 静 止 于 A 点 ,给 它 一 个 初始 速度 和 方向 ,如 果 球 撞 到 圆柱 体 , 它 会 弹 回 , 没 有 能 
量 损失 。 经 过 一 段 时 间 , 小 球 是 否 会 经 过 也 点 ? 


图 11.21 hdu 5572 题 图 示 
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这 是 一 道中 等 题 ,考核 参赛 人 员 对 几何 基本 模板 的 使 用 。 该 题目 的 逻辑 很 简单 ,但 是 综 
合 性 较 强 , 它 涉及 的 计算 几何 知识 有 直线 的 表示 、 圆 的 表示 \ 点 在 直线 上 的 投影 ,点 到 直线 的 
距离 ,点 对 于 直线 的 镜像 点 .线段 和 圆 的 关系 直线 和 圆 的 交点 等 。 

下 面 的 代码 完全 套用 了 前 面 给 出 的 模板 。 


# include <bits/stdc++.h> 
using namespace std; 
const double eps = le 一 8; // 本 题 如 果 设 定 eps = le- 10, 会 Wrong answer 
int sgn(double x){ // 判 断 x 是 否 等 于 0 
if(fabs(x) < eps) return 0; 
else return x<0? 一 1:1; 
上 
struct Point{ // 定 义 点 及 其 基本 运算 
double xy y; 
Point(){} 
Point(double x, double y) :x(x),y(y){} 
Point operator + (Point B){return Point(x+B.x,y+B.y);} 
Point operator — (Point B){return Point(x- B.x,y- B.y);} 
Point operator * (double k){return Point(x*k,y*k);} 
Point operator / (double k){return Point (x/k, y/k);} 
}; 
typedef Point Vector; // 定 义 向 量 
double Dot (Vector A, Vector B){return A.x*B.x + A.y*B.y;} // 点 积 
double Len(Vector A){return sqrt(Dot(A,A));}  // 向 量 的 长 度 
double Len2(Vector A){return Dot(A, A);} // 向 量 长 度 的 平方 
double Cross(Vector A, Vector B){return A.x*B.y — A.y*B.x;} // 叉 积 
double Distance(Point A, Point B){return hypot(A.x—B.x,A.y— B.y);} 
struct Line{ 
Point pl, p2; 
Line(){} 
Line(Point pl,Point p2) :pl(p1),p2(p2){} 
}; 
typedef Line Segment; // 定 义 线段 ,两 端点 是 pl 、p2 
int Point_line_relation(Point p, Line v){ 
int c = sgn(Cross(p—v.pl,v.p2—v.p1)); 


if(c < 0)return 1; //1: p 在 v 的 左边 
if(c > 0)return 2; //2: p 在 v 的 右边 
return 0; //0: p 在 v 上 

} 

double Dis_ point line(Point p, Line v){ // 点 到 直线 的 距离 


return fabs(Cross(p— v.Pl,v.p2—v.p1))/Distance(v. pl,v.p2); 

} 

// 点 到 线段 的 距离 

double Dis_point_seg(Point p, Segment v){ 
if(sgn(Dot(p—v.pl,v.p2—v.p1))<0 || sgn(Dot(p—v.p2,v.pl—v.p2))<0) 

return min(Distance(p,v.p1),Distance(p,v. p2)); 

return Dis point line(p,v); 

] 

// 点 在 直线 上 的 投影 
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Point Point line proj(Point p, Line v){ 
double k=Dot(v.p2—v.pl,p—v.pl)/Len2(v.p2— v.p1); 
return v.pl + (v.p2—v.pl)*k; 
// 点 p 对 直线 v 的 对 称 点 
Point Point line symmetry(Point p, Line v){ 
Point q = Point line proj(p,v); 
return Point(2*q.x—-p.x,2*q.y— p.y); 


. 

struct Circle{ 
Point c; // 圆 心 
double r; // 半 径 


Circle(){} 
Circle(Point c,double r):c(c),r(r){} 
Circle(double x, double y,double r){c=Point(x,y);r = _r;} 
}; 
// 线 段 和 圆 的 关系 : 0 为 线段 在 圆 内 ,1 为 线段 和 圆 相 切 ,2 为 线段 在 圆 外 
int Seg_circle relation(Segment v,Circle C){ 
double dst = Dis point seg(C.c,v); 
if(sgn(dst— C.r) < 0) return 0; 
if(sgn(dst— C.r) == 0) return 1; 
return 2; 
} 
// 直 线 和 圆 的 关系 : 0 为 直线 在 圆 内 ,1 为 直线 和 圆 相 切 ,2 为 直线 在 圆 外 
int Line_circle_relation(Line v, Circle C){ 
double dst = Dis point line(C.c,v); 
if(sgn(dst- C.r) < 0) return 0; 
if(sgn(dst- C.r) == 0) return 1; 
return 2; 
. 
// 直 线 和 圆 的 交点 ,pa、pb 是 交点 .返回 值 是 交点 的 个 数 
int Line cross circle(Line v,Circle C, Point &pa, Point &pb){ 
if(Line circle_ relation(v, C) == 2) return 0; // 无 交点 


Point q = Point line proj(C.c,v); // 圆 心 在 直线 上 的 投影 点 

double d = Dis_point line(C.c,v); // 圆 心 到 直线 的 距离 

double k = sqrt(C.rx*C.r—-dxd); 

if(sgn(k) == 0){ // 一 个 交点 ,直线 和 圆 相 切 
pa=q; pb= qi return1l; 

} 

Point n= (v.p2—v.p1)/ Len(v.p2—v.p1); // 单 位 向 量 


pa= q+ nx*k; 
pb=q- nx*k; 
return 2; // 两 个 交点 
上: 
int main() { 
int T; scanf("%d", &T); 
for (int cas = 1; cas <=T; cas++) { 
Circle 0; Point A,B,V; 
Scanf(" % 1f%1f%1f", &0.c.x, &0.c.y, &0.r); 
scanf("%1f%1f%1fS1f", SA.x, SA.y, SV.x, &V.y); 
scanf(" % 1f%1f", &B.x, &B.y); 
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Line 1(AM, A+V); // 射 线 
Line t(A, B); 
// 情 况 1: 直线 和 圆 不 相交 , 而 且 直线 经 过 点 
if(Point line relation(B,1) == 
&& Seg_circle relation(t,0)>=1 && sgn(Cross(B— A,V)) == 0) 
printf("Case # %d: Yes\n", cas); 
else{ 
Point pa, pb; // 直 线 和 圆 的 交点 
// 情 况 2: 直线 和 圆 相 切 , 不 经 过 点 
if(Line cross circle(1,0,pa,pb) != 2) 
printf("Case # %d: No\n", cas); 
// 情 况 3: 直线 和 圆 相交 
else{ 
Point cut; // 直 线 和 圆 的 碰撞 点 
if(Distance(pa,A) > Distance(pb,A)) cut = pb; 
else cut = pa; 


Line mid(cut, 0.c); // 圆 心 到 碰撞 点 的 直线 
Point en = Point line symmetry(A,mid); // 镜 像 点 
Line light(cut, en); // 反 射线 


if(Distance(light. p2,B) > Distance(light. pl1,B)) 
swap(light. pl, light. p2); 
if(sgn(Cross(light.p2 ~ light. pl, 
Point(B.x- cut.x,B.y— cut.y))) == 0) 
printf("Case # %d: Yes\n", cas); 
else 
printf("Case # %d: No\n", cas); 


return 0; 


11.2.2 最 小 圆 覆盖 


最 小 圆 覆盖 问题 : 给 定 个 点 的 平面 坐标 , 求 一 个 半径 最 小 的 圆 ,把 个 点 全 部 包围 ， 
部 分 点 在 圆 上 。 
常见 的 算法 有 两 种 , 即 几 何 算法 和 模拟 退火 算法 。 


1. 几何 算法 

这 个 最 小 圆 可 以 由 个 点 中 的 两 个 点 或 3 个 点 确定 。 巾 两 点 定 圆 时 ,圆心 是 线段 AB 
的 中 点 ,半径 是 AB 长 度 的 一 半 , 其 他 点 都 在 这 个 贺 
内 ; 如 果 两 点 不 足以 包围 所 有 点 ,就 需要 三 点 定 圆 ， 
此 时 圆心 是 A、B、C 这 3 个 点 组 成 的 三 角形 的 外 心 ，“ J 


如 图 11. 22 所 示 。 
最 小 覆盖 圆 的 获得 就 是 寻找 能 两 点 定 圆 或 三 点 
定 圆 的 那 几 个 点 。 


图 11.22 两 点 定 圆 或 三 点 定 圆 
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一 般 用 增 量 法 求 最 小 圆 覆 盖 。 算 法 从 一 个 点 开始 ,每 次 加 入 一 个 新 的 点 , 则 更 新 最 小 
圆 , 直 到 扩展 到 全 部 个 点 。 设 前 i 个 点 的 最 小 覆盖 圆 是 C; ,过 程 如 下 : 

(1) 加 第 1 个 点 p1。Ci 的 圆心 就 是 pi ,半径 为 0。 

(2) 加 第 2 个 点 如。 新 的 Cs 的 圆心 是 线段 pip: 的 中 心 ,半径 为 两 点 距离 的 一 半 。 这 
一 步 操作 是 两 点 定 圆 。 

(3) 加 第 3 个 点 p83。 有 两 种 情况 : ps 在 C: 的 内 部 或 圆周 上 ,不 影响 原来 的 最 小 圆 , 忽 
略 ps; ps 在 C: 的 外 部 ,此 时 Cs 已 不 能 覆盖 所 有 3 个 点 ,需要 更 新 。 下 面 讨 论 p; 在 Cs 外 
部 的 情况 。 因 为 ps 一 定 在 新 的 C; 上 ,现在 的 任务 转换 为 在 请 、ps 中 找 一 个 点 或 两 个 点 ,与 
ps 一 起 两 点 定 圆 或 三 点 定 圆 。 重 新 定 圆 的 过 程 相当 于 回 到 第 (1) 步 ,把 ps 作为 第 1 个 点 加 
入 ,然后 再 加 入 pi 、ps。 

(4) 加 第 4 个 点 ps。 分 析 和 步骤 (3) 类 似 ,为 加 强 理解 ,这 里 重复 说 明 一 次 。 如 果 ps 在 
Cs 的 内 部 或 圆周 上 ,忽略 它 。 如 果 在 Cs 的 外 部 ,那么 需要 求 新 的 最 小 圆 , 此 时 ps 肯定 在 新 
的 C, 的 圆周 上 。 任 务 转换 为 在 pi 、ps、ps 中 找 一 个 点 或 两 个 点 ,与 ps 一 起 构成 最 小 圆 。 先 
检查 能 不 能 找到 一 个 点 ,用 两 点 定 圆 ; 如 果 两 点 不 够 ,就 找到 第 3 个 点 ,用 三 点 定 圆 。 重 新 
定 圆 的 过 程 和 前 3 个 步骤 类 似 , 即 把 ps 作为 第 1 个 点 加 入 ,然后 加 入 pi 、ps、ps。 

(5) 持续 进行 下 去 ,直到 加 完 所 有 点 。 

算法 的 思路 概括 如 下 : 

假设 已 经 求 得 前 i 一 1 个 点 的 Ci-1 ,现在 加 入 第 i 个 点 ,有 两 种 情况 。 

(1) i 在 C;_! 的 内 部 或 圆周 上 ,忽略 i。 

(2) i 在 Ci 1 的 外 部 ,需要 求 新 的 C;。 首 先 ,i 肯定 在 C; 上 ,然后 重新 把 前 面 的 i 一 1 个 
点 依次 加 入 ,根据 两 点 定 圆 或 者 三 点 定 圆 重新 构造 最 小 圆 。 

几何 算法 的 复杂 度 分 析 。 在 下 面 的 例题 中 给 出 了 模板 代码 。 其 中 有 3 层 for 循环 ,看 
起 来 似乎 是 OG)。 不 过 ,如 果 点 的 分 布 是 随机 的 ,用 概率 进行 分 析 可 以 得 出 程序 的 复杂 度 
是 接近 O(n) 的。 在 下 面 的 代码 中 ,用 random_shuffle() 函 数 进行 随机 打 乱 。 

例如 ,如 果 前 两 个 点 如 和 ps 恰好 就 是 最 后 的 两 点 定 圆 ,那么 其 他 的 所 有 点 都 只 需要 检 
查 一 次 是 否 在 C; 内 就 行 了 ,程序 在 第 一 层 for 就 结束 了 。 对 于 算法 复杂 度 的 详细 证 明 , 请 
读者 查阅 有 关 资 料 。 

下 面 的 例题 是 最 小 圆 覆盖 的 裸 题 。 


hdu 3007 “Buried memory” 
输入 nn 个 点 的 坐标 ,n 二 500, 求 最 小 圆 履 盖 。 


代码 如 下 : 


#include < bits/stdc++.h> 
using namespace std; 
#define eps le—8 
const int maxn = 505; 
int sgn(double x){ 
if(fabs(x) <eps) return 0; 
else return xX<0? 一 1:1; 
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} 
struct Point{ 
double x, y; 
}; 
double Distance(Point A, Point B){return hypot(A.x—B.x,A.y— B.y);} 
// 求 三 角形 abc 的 外 接 圆 的 圆心 
Point circle_center(const Point a, const Point b, const Point c){ 
Point center; 
double al =b.x—a.x, bl=b.y—a.y, cl= (al *al+bl*b1)/2; 
double a2=c.x-a.x, b2=c.y-a.y, c2= (a2*a2+b2*b2)/2; 
double d=al * b2— a2*xbl; 
center.x=a.x+ (cl* b2— c2*b1)/d; 
center.y=a.y+ (al * c2— a2* c1)/d; 
return center; 
// 求 最 小 覆盖 圆 ,返回 圆心 .半径 r: 


void min cover circle(Point * p，int n，Point &c，double &r){ 


random_shuffle(p, p + n); // 随 机 函数 , 打 乱 所 有 点 .这 一 步 很 重要 
c=p[0]; r=0; // 从 第 1 个 点 p0 开始 .圆心 为 p0, 半 径 为 0 
for(int i=1;i<n;i+t+) // 扩 展 所 有 点 
if(sgn(Distance(p[i],c) —r)>0){ // 点 pi 在 圆 的 外 部 
c=p[lil; r=0; // 重 新 设置 圆心 为 pi, 半 径 为 0 
for(int j=0;j<i;j++) // 重 新 检查 前 面 所 有 的 点 


if(sgn(Distance(p[j],c) -r)> 0){ // 两 点 定 圆 
c.x= (p[i].x + p[j].x)/2; 
c.Y= (p[i.Y + p[j].Y)/2; 
r=Distance(p[j],c); 
for(int k=0;k<j;k+t+) 
if (sgn(Distance(p[k],c) - r)> 0){ // 两 点 不 能 定 圆 就 三 点 定 圆 
c= circle center(p[i],p[j],p[k]); 
r=Distance(p[i], c); 


} 
} 
} 
int main(){ 
int n; // 点 的 个 数 
Point p[maxn]; // 输 入 点 
Point c; double r; // 最 小 覆盖 圆 的 圆心 和 半径 


while(~scanf("%d",gn) && n){ 
for(int i=0;i<n;it+) scanf(" %1f %1f",gp[i].x,&p[i].y); 
min cover circle(p,n,c,r); 
Printft("® .2F $1.28 %.2\n cme wr) 


} 
return 0; 
} 
2. 模拟 退火 算法 


如 果 题 目的 数据 规模 不 大 ,最 小 圆 覆盖 还 可 以 用 模拟 退火 算法 实现 ,请 读者 先 回顾 第 6 
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章 的 “6. 1. 4 模拟 退火 ”。 用 模拟 退火 求 最 小 圆 ,不 断 迭 代 ( 降 温 ); 在 每 次 迭代 时 ,找到 能 覆 
盖 到 所 有 点 的 一 个 圆 ; 在 多 次 迭代 中 ,逐步 逼近 最 后 要 求 的 圆心 和 半径 。 
下 面 的 函数 min_cover_circle() 是 模拟 退火 程序 ,用 它 替换 上 面 的 同名 函数 即 可 。 


void min cover circle(Point *p, int n, Point &c, double gr){ 


double T = 100.0; // 初 始 温度 
double delta = 0.98; // 降 温 系数 
c= p[0]， 
int pos; 
while (T > eps){ //eps 是 终止 温度 
pos = 0; r=0; // 初 始 : p[0] 是 圆心 ,半径 是 0 
for(int i = 0; i<=n — 1; i++) // 找 距 圆心 最 远 的 点 
if (Distance(c, p[i])> 7r){ 
r = Distance(c, p[i]); // 距 圆心 最 远 的 点 肯定 在 圆周 上 
pos = i; 


} 
c.x += (p[pos].x - c.x) /rx* TT; // 通 近 最 后 的 解 
c.y t= (plpos].y - c.y) /r* 了 ; 
T*= delta; 


|; 


模拟 退火 的 程序 很 简单 ,不 过 需要 仔细 选择 初始 温度 工 .降温 系数 delta、 
终止 温度 eps 等 ,程序 的 复杂 度 也 和 它们 有 关 。 在 本 题 中 ,模拟 退火 算法 的 复 
杂 度 远 高 于 几何 算法 。OJ 返回 的 AC 时 间 , 几 何 算法 是 46ms, 模 拟 退 火 
是 670ms。 


【习题 】 


hdu 2215 ,最 小 圆 覆 盖 。 


11.3 三 维 几 何 


11.3.1 三 维 点 和 向 量 


1. 点 和 向 量 
在 三 维 几 何 中 ,点 和 向 量 的 表示 和 二 维 几 何 是 类 似 的。 同样 也 可 以 定义 三 维 空间 的 运算 。 
struct Point3{ // 三 维 点 

double x, Yr z; 

Point3(){} 


Point3(double x, double y, double z) :x(x),y(y),z(z){} 

Point3 operator + (Point3 B){return Point3(x+B.x,y+B.y,z+B.z);} 
Point3 operator — (Point3 B){return Point3(x-B.x,y- B.y,z-B.z);} 
Point3 operator * (double k){return Point3(x*k,y*k,z*k);} 


“300。 


第 11 章 计算 几何 


Point3 operator / (double k){return Point3(x/k, y/k,z/k);} 
bool operator == (Point3 B){ 
return sgn(x 一 B.x) ==0 && sgn(y— B.y) ==0 && sgn(z—B.z)==0;} 
}; 
typedef Point3 Vector3; // 三 维 向 量 
点 和 点 的 距离 O: 
double Distance(Vector3 A, Vector3 B){ 
return sqrt((A.x—B.x)* (A.x—B.x)+ 
(A.Y-B.y)* (A.y—B.y)+ 
(A.z—B.z)* (A.z—B.z)); } 


2. 线 和 线段 
和 二 维 一 样 ,三 维 的 直线 和 线段 也 用 两 点 定义 。 
struct Line3{ 

Point3 pl, p2; 

Line3(){} 

Line3(Point3 pl, Point3 p2) :pl(p1),p2(p2){} 


}; 
typedef Line3 Segment3; // 定 义 线段 ,两 端点 是 Point pl1,p2 


11.3.2 三 维 点 积 


1. 点 积 

三 维 点 积 的 定义 和 二 维 的 类 似 , 定 义 如 下 : 
A.B=|A||Blcos0 

求 向 量 A、B 点 积 的 代码 如 下 : 


double Dot (Vector3 A, Vector3 B){return A.x*B.x+A.y*B.y+A.z*B.z;} 


2. 点 积 的 基本 应 用 

和 二 维 点 积 一样 , 三 维 点 积 有 以 下 基本 应 用 : 
1) 判断 向 量 4 与 B 的 夹 角 是 钝 角 还 是 锐角 
点 积 有 正 负 ,利用 正 负 号 可 以 判断 向 量 的 夹 角 : 
若 dot(4,B) 二 0,4 与 B 的 夹 角 为 锐角 ; 

若 dot(4,B) 一 0,4 与 B 的 夹 角 为 钝 角 ; 

若 dot(4,B) 一 0,4 与 B 的 夹 角 为 直角 。 

2) 求 向 量 A 的 长 度 


double Len(Vector3 A){return sqrt(Dot(A, A));} 
或 者 是 求 长 度 的 平方 ,避免 开 方 运算 : 
double Len2(Vector3 A){return Dot(A, A);} 


四 读者 可 能 注意 到 ,本 章 给 出 的 三 维 函数 和 二 维 函 数 很 多 是 重 名 的 ,例如 这 里 的 Distance()。C++ 人 允许 函数 重 载 ， 
所 以 即使 在 同一 个 程序 中 用 同名 来 定义 不 同 的 函数 也 是 允许 的 。 而 且 建 议 重 载 函数 ,这 样 做 可 以 简化 编程 。 
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3) 求 向 量 A 与 B 的 夹 角 大 小 

double Angle(Vector3 A, Vector3 B){return acos(Dot(A,B)/Len(A)/Len(B));} 
11.3.3 三 维 又 积 


二 维 又 积 是 一 个 带 正 负 的 数值 ,而 三 维 又 积 是 一 个 向 量 。 可 以 把 三 维 向 量 4、B 的 又 积 看 
成 垂直 于 4 和 有 的 向 量 ,如 图 11. 23 所 示 , 其 方向 符合 “右手 定 则 ”。 i 
三 维 又 积 的 计算 和 二 维 又 积 相似 ,不 同 的 是 计算 后 返回 一 个 向 量 ， 


A 
Vector3 Cross(Vector3 A, Vector3 B){ 
return Point3(A.y*B.z—A.zx*B.y, A.zx*B.x—A.x*x*B.z, A.x*B.y— B 
A.y*x B.x); 
' 11.23 三 维 叉 积 
1. 三 角形 面积 


三 维 的 三 角形 面积 计算 和 二 维 的 相似 ,也 是 有 向 面积 。 先 求 三维 叉 积 , 然 后 取 叉 积 的 长 
度 值 。 

// 三 角形 面积 的 两 倍 

double Area2(Point3 R, Point3 B,Point3 C){return Len(Cross(B—A, C-A));} 


判断 点 p 是 否 在 三 角形 ABC 内 ,可 以 用 Area2() 来 计算 。 如 果 点 p 在 三 角形 内 部 , 那 
么 用 点 pb 对 三 角形 ABC 进行 三 角 剖 分 ,形成 的 3 个 三 角形 的 面积 和 与 直接 算 ABC 的 面积 ， 
两 者 应 该 相等 : 


Dcmp(Area2(p,A,B) + Area2(p,B,C) + Area2(p,C,A), Area2(A,B,C)) ==0 


2. 点 和 线 的 有 关 问 题 


点 到 直线 的 距离 .点 是 否 在 直线 上 、 点 到 线段 的 距离 、 点 在 直线 上 的 投影 等 问题 的 代码 
和 二 维 几 何 相 似 , 见 本 章 11.4 节 的 几何 模板 。 
3. 平面 


用 3 个 点 可 以 确定 一 个 平面 。 


struct Plane{ 
Point3 pl, p2, p3; // 平 面 上 的 3 个 点 
Plane(){} 
Plane(Point3 pl, Point3 p2, Point3 p3) :pl(p1), p2(p2), p3(p3){} 
}; 
4. 平面 法 向 量 
平面 法 向 量 是 垂直 于 平面 的 向 量 , 在 平面 问题 中 非常 重要 。 它 用 又 积 的 概念 计算 即 可 ， 
代码 如 下 : 
Point3 Pvec(Point3 A, Point3 B, Point3 C){return Cross(B— A,C— A);} 
或 者 : 
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Point3 Pvec(Plane f){return Cross(f.p2—f.pl,f.p3—f.p1);} 


5. 平面 的 有 关 问 题 
四 点 共 平 面 、 两 平面 平行 两 平面 垂直 等 问题 的 代码 见 本 章 11. 4 节 的 几何 模板 。 
6. 直线 和 平面 的 交点 


直线 和 平面 有 3 种 关系 , 即 直线 在 平面 上 ,直线 和 平面 平行 .直线 和 平面 有 交点 。 

一 个 平面 ,可 以 用 平面 上 上 的 一 点 f. pl 以 及 平面 的 法 向 量 v 来 决定 。 直 线 w 用 两 点 
u. pl 和 . p2 决定 。 

下 面 的 函数 计算 直线 与 平面 的 交点 ,交点 是 p, 函 数 的 返回 值 是 交点 的 个 数 。 


int Line_cross_plane(Line3 u, Plane f, Point3 &p){ 
Point3 v = Pvec(f); // 平 面 的 法 向 量 
double x = Dot(v, u.p2-f£.p1); 
doubley = Dot(v, u.pl-f.p1); 
doubled = x-—y; 
if(sgn(x) == 0 && sgn(y) == 0) return -1;//-1:v 在 f 上 


if(sgn(d) == 0) return 0; //0: v 与 f 平 行 
p= ((upl * x)-(u.p2 * y))/d; //1: v 与 三 相交 
return 1; 

] 

下 面 解释 代码 的 正确 性 。 


代码 中 的 vv 是 平面 的 法 向 量 , 它 不 一 定 是 单位 法 向 量 ,不 过 这 里 把 它 看 成 是 单位 法 向 
量 , 不 影响 后 续 推 理 的 正确 性 。z 二 Dot(wv,u. p2 一 f. pl1) 是 u. p2 到 平面 f 的 距离 ,y== 
Dot(v,u. pl 一 了 .p1) 是 .pl 到 平面 的 距离 。 如 果 x 二 y 二 0, 说 明 直 线 在 平面 上 ; 如 果 > 一 
y 冯 0, 即 直线 上 的 两 点 到 平面 的 距离 相等 ,说 明 直线 和 平面 平行 。 

如 果 直 线 和 平面 相交 ,如 何 计算 交点 ? 

如 图 11. 24 所 示 , 在 x、y、z 轴 的 任何 一 个 方向 上 都 

Pi 了 | Wd 2 
有 4 一色 一 守 , 推 导 得 p 一 人 

7. 四 面体 的 有 向 体积 

四 面体 是 最 简单 的 立体 结构 。 四 面体 的 体积 等 于 底 
面 三 角形 面积 乘 以 高 的 1/3, 利 用 又 积 和 点 积 很 容易 计 
算 ,代码 如 下 ， 

// 四 面体 有 向 体积 x6 


double volume4(Point3 a, Point3 b, Point3 c,Point3 d){ 
return Dot(Cross(b-a,c—-a),d-a); } 


11. 24 直线 和 平面 的 交点 


【习题 】 


hdu 1140/4617 。 
hdu 5733 ,四 面体 。 
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11.3.4 最 小 球 覆盖 


最 小 球 覆盖 问题 : 给 定 n 个 点 的 三 维 坐 标 , 求 一 个 半径 最 小 的 球 ,把 个 点 全 部 包围 
进来 。 

和 最 小 圆 覆 盖 一 样 ,最 小 球 覆 盖 问 题 也 有 两 种 解法 , 即 几何 算法 和 模拟 退火 算法 。 

1. 模拟 退火 算法 

如 果 数 据 规模 较 小 ,可 以 用 模拟 退火 算法 求 最 小 球 覆 盖 。 其 代码 和 最 小 圆 覆盖 的 程序 
几乎 一 样 ,只 需 加 上 对 坐标 的 处 理 即 可 。 

2. 几何 算法 

和 最 小 圆 覆盖 增 量 法 的 思路 类 似 , 最 小 球 覆 盖 也 可 以 由 一 些 点 来 确定 。 一 个 三 维 空间 
中 的 球 ,需要 1 一 4 个 点 来 确定 。 可 以 从 一 个 点 开始 ,每 次 加 入 一 个 新 的 点 ,更 新 最 小 球 , 直 
到 扩展 到 全 部 个 点 。 设 前 i 个 点 的 最 小 覆盖 球 是 C, ,简单 说 明 如 下 : 

(1) 1 个 点 。C 的 球 心 就 是 pi ,半径 为 0。 

(2) 2 个 点 。 新 的 Cs 的 球 心 是 线段 pips 的 中 心 ,半径 为 两 点 距离 的 一 半 。 

(3) 3 个 点 。3 个 点 构成 的 平面 一 定 是 球 的 大 圆 所 在 的 平面 ,所 以 球 心 是 三 角形 的 外 
心 ,半径 就 是 球 心 到 某 个 点 的 距离 。 

(4) 4 个 点 。 若 4 个 点 共 面 则 转化 到 (3) ,考虑 某 3 个 点 的 情况 , 若 4 点 不 共 面 ,四 面体 
可 以 唯一 确定 一 个 外 接 球 。 

(5) 对 于 5 个 及 以 上 点 ,其 最 小 球 必 为 其 中 某 4 个 点 的 外 接 球 。 

最 小 覆盖 球 的 代码 比较 复杂 。 读 者 可 以 通过 下 面 的 例题 来 了 解 最 小 覆盖 球 问题 的 几何 
算法 。 


poj 2069 “Super Star” 
输入 个 点 的 三 维 坐 标 ,4 三 n 三 30, 求 最 小 球 履 盖 , 输 出 球 的 半径 。 


11.3.5 三 维 凸 包 


三 维 凸 包 问题 : 给 定 三 维 空间 的 一 些 点 ,找到 包含 这 些 点 的 最 小 凸 多 面体 。 三 维 凸 包 
问题 是 二 维 凸 包 问 题 的 扩展 , 它 是 一 个 比较 难 的 问题 。 

如 果 用 暴力 法 求 三 维 凸 包 , 可 以 枚 举 任 意 3 个 点 组 成 的 三 角形 ,判断 其 他 点 是 否 都 在 三 
角形 构成 的 平面 的 一 侧 , 如 果 是 , 则 这 个 三 角形 是 凸 包 的 一 个 面 。 

三 维 凸 包 的 常用 算法 是 增 量 法 。 该 算法 的 思想 和 最 小 圆 覆盖 的 增 量 法 有 些 类 似 , 即 把 
点 一 个 个 加 入 到 凸 包 中 。 首 先 找到 4 个 不 共 线 、 不 共 面 的 点 ,一 起 构成 一 个 四 面体 ,这 是 初 
始 凸 包 ,然后 依次 检查 其 他 点 ,看 这 个 点 是 否 能 在 原 凸 包 的 基础 上 构成 新 的 凸 包 。 例 如 , 当 
检查 到 点 p; 时 有 两 种 情况 : 

(1) 如 果 户 在 当前 的 凸 包 内 ,忽略 它 。 

(2) 如 果 pi; 不 在 凸 包 内 ,说明 用 p; 可 以 更 新 凸 包 。 具 体 做 法 是 从 p; 点 向 凸 包 看 去 ,将 
能 看 到 的 面 全 部 删除 ,并 把 p; 和 留 下 的 轮廓 组 合成 新 的 面 ,填补 被 删除 的 面 。 


* 304.: 


第 11 章 计算 几何 


三 维 凸 包 题目 的 相关 问题 有 凸 包 有 几 个 表面 . 凸 包 的 表面 积 \ 凸 包 的 重心 等 。 
复杂 度 。 如 果 给 定 的 点 是 随机 排列 的 ,算法 的 期 望 时 间 是 O(nlogzn) 0 的 。 
下 面 用 一 个 例题 给 出 三 维 凸 包 的 模板 代码 。 


hdu 3662 “3D Convex Hull” 
输入 nn 个 点 的 三 维 坐 标 , 求 三 维 西 包 有 几 个 面 。 


代码 如 下 ®@，: 


#include <bits/stdc++.h> 
using namespace std; 
const int MAXN = 1050; 
const double eps = le— 8; 
struct Point3{ // 三 维 : 点 
double x, y, 2z; 
Point3(){} 
Point3(double x, double y, double z) :x(x),y(y),z(z){} 
Point3 operator + (Point3 B){return Point3(x+B.x,y+B.y,z+B.z);} 
Point3 operator - (Point3 B){return Point3(x—B.x,y- B.y,z-B.z);} 
Point3 operator * (double k){return Point3(x*k,y*k,zx*k);} 
Point3 operator / (double k){return Point3(x/k, y/k, z/k);} 
}; 
typedef Point3 Vector3; 
double Dot(Vector3 A,Vector3 B){return A.x*B.x+A.y*B.y+A.z*xB.z;} 
Point3 Cross(Vector3 A, Vector3 B){ 
return Point3(A.y*B.z—A.z*B.y,A.z*B.x—A.x*B.z,A.x*B.y- A.y*B.x);} 
double Len(Vector3 A){return sqrt(Dot(A,A));} // 向 量 的 长 度 
double Area2(Point3 A, Point3 B,Point3 C){return Len(Cross(B—A, C—A));} 
// 四 面体 有 向 体积 x6 
double volume4(Point3 A, Point3 B, Point3 C, Point3 D){ 
return Dot(Cross(B- A,C— A),D-A);} 
struct CH3D{ 
struct face{ 


int a,b,c; // 凸 包 一 个 面 上 的 3 个 点 的 编号 
bool ok; // 该 面 是 否 在 最 终 凸 包 上 

}; 

int n; // 初 始 顶 点 数 

Point3 P[MAXN]; // 初 始 顶 点 

int num; // 凸 包 表 面 的 三 角形 数 

face F[8 * MAXN]; // 凸 包 表 面 的 三 角形 

int g[ MAXN] [MAXN]; // 点 i 到 点 j 属 于 哪个 面 

// 点 在 面 的 同 向 


double dblcmp(Point3 &p, face &f){ 
Point3 m= P[f.b] ~ P[f.a]; 
Point3 n=P[f.c] ~ P[f.al]; 


@ 证 明 见 (计算 几何 算法 与 应 用 (第 3 版 )),Mark de Berg 等 著 , 邓 俊 辉 译 ,清华 大 学 出 版 社 ,257 页 。 
回 ” 此 代码 中 的 CH3DO 〇 是 流传 很 广 的 经 典 模板 ,如 果 CH3D() 的 原作 者 看 到 这 里 ,请 联系 本 书 作 者 。 
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Point3 t =p—P[f.al]; 
return Dot(Cross(m,n),t); 
} 
void deal(int p, int a, int b){ 
intf=g[a][b]; // 搜 索 与 该 边 相 邻 的 另 一 个 平面 
face add; 
if(F[£].ok){ 
if(dblcmp(P[p],F[£])> eps) 
// 如 果 从 p 点 能 看 到 该 面 f, 则 继续 深度 探索 王 的 3 条 边 , 以 更 新 新 的 凸 面 
dfs(p,£); 
else{ 
// 如 果 从 p 点 看 不 到 f 面 , 则 p 点 和 a、b 点 组 成 一 个 三 角形 
add.a= b; 
add.b=a; 
add.c=p; 
add. ok = true; 
g[p][b] =g[a][p] = g[b][a] = num; 
F[num++ ] = add; 


} 
} 
void dfs(int p, int now){ // 维 护 凸 包 , 如果 点 p 在 凸 包 外 则 更 新 凸 包 
F[now].ok=0; 
deal(p,F[now].b,F[now].a); 
deal(p,F[now].c,F[now].b); 
deal(p,F[now].a,F[now].c); 
: 
bool same( int s, int 七 ){ // 判 断 两 个 面 是 否 为 同一 面 
Point3 ga= P[F[s].al]; 
Point3 gb= P[F[s].b]; 
Point3 gc=P[F[s].c]; 
return fabs(volume4(a,b,c,P[F[t].al]))< eps && 
fabs(volume4(a, b,c,P[F[t].b]))< eps && 
fabs(volume4(a, b,c,P[F[t].c]))<eps; 
} 
// 构 建 三 维 凸 包 
void create(){ 
int i,j,tmp; 
face add; 
num= 0; 
if(n<4)return; 
// 前 4 个 点 不 共 面 
bool flag = true; 
for(i=1;i<n;itt){ // 使 前 两 个 点 不 共 点 
if(Len(P[0] ~- P[i])> eps){ 
swap(P[1],P[i]); 
flag = false; 
break; 
} 
} 
if(flag)return; 
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flag= true; 
// 使 前 3 个 点 不 共 线 
for(i=2;i<n;it+){ 
if(Len(Cross(P[0] - P[1],P[1] — P[i]))> eps){ 


swap(P[2],P[i]); 
flag = false; 
break; 
} 

} 

if(flag)return; 

flag = true; 

// 使 前 4 个 点 不 共 面 


for(int i=3;i<n;i++){ 
if(fabs(Dot(Cross(P[0] ~ P[1], P[1] ~ P[2]),P[0] ~- P[i]))> eps){ 
swap(P[3], P[i]); 
flag = false; 
break; 
} 
} 
if(flag)return; 
for(i=0;i<4;itt){ // 构 建 初始 四 面体 (4 个 点 为 p[0] 、p[1]、p[2]、p[3]) 
add.a= (i+1)%4; 
add.b= (i+2)%4; 
add.c= (i+3)%4; 
add. ok = true; 
if(dblcmp(P[i],add)> 0)swap(add. b,add. c); 
// 保 证 道 时 针 , 即 法 向 量 朝 外 ,这 样 新 点 才 可 看 到 
g[add.a][add.b] = g[add. b][add.c] = g[add.c][add.a] = num; 
// 逆 向 的 有 向 边 保存 
F[num++ ] = add; 
} 
for(i=4;i<n;it+){ // 构 建 更 新 凸 包 
for(j=0;j<num;j+t+){ 
// 判 断 点 是 否 在 当前 三 维 凸 包 内 ,i 表示 当前 点 ,j 表示 当前 面 
if(F[j].okg&&dblcmp(P[i],F[j])> eps){ 
// 对 当前 凸 包 面 进行 判断 ,看 点 能 否 看 到 这 个 面 
dfs(i,j); // 点 能 看 到 当前 面 ,更 新 凸 包 的 面 
break; 


} 
} 
tmp = num; 
for(i= num= 0;i< tmp;i++) 
if(F[i].ok) 
F[numt+] =F[i]; 
} 
// 凸 包 的 表面 积 
double area( ){ 
double res = 0; 
for(int i=0;i<num;i++) 
res += Area2(P[F[i].al],P[F[i].b],P[F[i].c]); 
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return res/2.0; 
} 
// 体 积 
double volume( ){ 
double res = 0; 
Point3 tmp(0,0,0); 
for(int i=0;i<num;it+) 
res += volume4(tmp, P[F[i].a],P[F[i].b],P[F[i].c]); 
return fabs(res/6.0); 
由 
// 表 面 三 角形 个 数 
int triangle(){ 
return num; 
} 
// 表 面 多 边 形 个 数 
int polygon( ){ 
int i,j,res, flag; 
for(i=res=0;i<num;it+){ 
flag=1; 
for(j=0;j<i;j++) 
if(same(i,j)){ 
flag= 0; 
break; 
} 
res += flag; 
} 
return res; 
} 
}; 
CH3D hull; 
int main(){ 
while(scanf("%d",&hull.n) ==1){ 
for(int i=0;i<hull.n;i+t+) 
scanf(" % 1f % 1f%1f",ghull.P[i].x, Shull.P[i].y, &hull. P[i]. 2); 
hull. create( ); 
printf(" % d\n", hull. polygon()); 
} 


return 0; 


【习题 】 


hdu 4273, 三 维 凸 包 重 心 。 
hdu 3662 。 


11.4 几何 模板 


下 面 给 出 了 本 章 的 模板 代码 ,以 便于 用 户 编程 时 参考 。 
*。308 。 


第 11 章 计算 几何 


const double pi = acos( 一 1.0); // 高 精度 圆周 率 
const double eps = le 一 8; // 偏 差 值 

const int maxp = 1010; // 点 的 数量 

int sgn(double x){ // 判 断 x 是否 等 于 0 


if(fabs(x) < eps) return 0; 
else return x<0? 一 1:1; 
int Dcmp(double x, double y){ // 比 较 两 个 浮 点 数 : 0 为 相等 ; -1 为 小 于 ; 1 为 大 于 
if(fabs(x — Y) < eps) return 0; 
else return x<y?-1:1; 


struct Point{ // 定 义 点 及 其 基本 运算 
double x, y; 
Point(){} 
Point(double x, double Y) :x(x),y(y){} 
Point operator + (Point B){return Point(x+B.x,y+B.y);} 
Point operator - (Point B){return Point(x— B.x,y- B.y);} 
Point operator * (double k){return Point(x*k,y*k);} // 长 度 增 大 k 倍 


Point operator / (double k){return Point(x/k, y/k);} // 长 度 缩小 k 倍 
bool operator == (Point B){return sgn(x—B.x)==0 && sgn(yY-B.Y) == 0;} 
bool operator < (Point B){ // 比 较 两 个 点 ,用 于 凸 包 计算 
return sgn(x—B.x)<0 || (sgn(x-B.x) ==0 && sgn(y—B.y)<0);} 
}; 
typedef Point Vector; // 定 义 向 量 
double Dot (Vector A, Vector B){return A.x*B.x + A.y*B.y;} // 点 积 
double Len(Vector A){return sqrt(Dot(A,A));} // 向 量 的 长 度 
double Len2(Vector AR){return Dot(A, A);} // 向 量 长 度 的 平方 
/人 与 B 的 夹 角 


double Angle(Vector A, Vector B){return acos(Dot(A,B)/Len(A)/Len(B));} 
double Cross(Vector A, Vector B){return A.x*B.y — A.y*B.x;} // 叉 积 
// 三 角形 ABC 面积 的 两 倍 
double Area2(Point A, Point B, Point C){return Cross(B-— A, C-A);} 
// 两 点 的 距离 ,用 两 种 方式 实现 
double Distance(Point A, Point B){return hypot(A.x—B.x,A.y— B.y);} 
double Dist(Point A, Point B){ 

return sqrt((A.x—B.x)* (A.x—B.x) + (A.y-B.y)* (A.y-B.y));} 


// 向 量 A 的 单位 法 向 量 

Vector Normal(Vector A){return Vector( - A.y/Len(A), A.x/Len(A));} 

// 向 量 是 否 平行 或 重合 

bool Parallel(Vector A, Vector B){return sgn(Cross(A,B)) == 0;} 

Vector Rotate(Vector A, double rad){ // 向 量 A 逆 时 针 旋 转 rad 度 


return Vector(A.x* cos(rad) ~- A.y* sin(rad), A.x* sin(rad) +A.y* cos(rad)); 
} 
struct Line{ 

Point pl, p2; // 线 上 的 两 个 点 

Line(){} 

Line(Point pl,Point p2) :pl(p1),p2(p2){} 

// 根 据 一 个 点 和 倾斜 角 angle 确定 直线 ,0<angle < pi 

Line(Point p, double angle){ 
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pl=p; 
if(sgn(angle — pi/2) == 0){p2 = (pl + Point(0,1));} 
else{p2 = (pl + Point(1,tan(angle)));} 
} 
//ax+by+c=0 
Line(double a, double b, double c){ 
if(sgn(a) == 0){ 
pl = Point(0, - c/b); 
p2 = Point(1, - c/b); 
} 
else if(sgn(b) == 0){ 
pl = Point( - c/a,0); 
p2 = Point( -c/a,1); 


elsef 
pl = Point(0, - c/b); 
p2 = Point(1,(-c-a)/b); 
} 
} 
}; 
typedef Line Segment; // 定 义 线段 ,两 端点 是 Point pl, p2 


// 返 回 直线 倾斜 角 , 0<angle < pi 
double Line_angle(Line v){ 
double k = atan2(v.p2.y— Vv.pl.y, v.p2.x—v.pl.x); 
if(sgn(k) < 0)k += pi; 
if(sgn(k- pi) == 0)k -= pi; 
return k; 
} 
// 点 和 直线 的 关系 :1 为 在 左 侧 ;2 为 点 在 右 侧 ;0 为 点 在 直线 上 
int Point_line relation(Point p, Line v){ 
int c = sgn(Cross(p—v.pl,v.p2—v.p1)); 


if(c < 0)return 1; //1: p 在 v 的 左边 
if(c > 0)return 2; //2: p 在 v 的 右边 
return 0; //0: p 在 v 上 


由 
// 点 和 线段 的 关系 : 0 为 点 p 不 在 线段 v 上 ; 1 为 点 p 在 线段 v 上 
bool Point_on_seg(Point p，Line v){ 
return sgn(Cross(p—v.pl, v.p2-v.p1)) == 0 && 
sgn(Dot(p—v.pl,p-v.p2)) <= 0; 
// 两 直线 的 关系 :0 为 平行 ,1 为 重合 ,2 为 相交 
int Line relation(Line v1, Line v2){ 
if(sgn(Cross(v1.p2— v1.pl,v2.p2— v2.p1)) == 0){ 
if(Point line relation(vl.pl,v2) ==0) return 1; //1: 重合 


else return 0; //0: 平行 
} 
return 2; //2: 相交 
} 
// 点 到 直线 的 距离 


double Dis point line(Point p, Line v){ 
return fabs(Cross(p— v.pl,v.p2—v.p1))/Distance(v. pl,v.p2); 
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} 

// 点 在 直线 上 的 投影 

Point Point line proj(Point p, Line v){ 
double k=Dot(v.p2—v.pl,p—v.pl)/Len2(v.p2—v.p1); 
return v.pl + (v.p2—v.pl)*k; 

| 

// 点 Pp 对 直线 v 的 对 称 点 

Point Point line symmetry(Point p, Line v){ 
Point q = Point_line proj(p,v); 
return Point(2*q.x— Pp.x,2*q.y- Pp.y); 

J. 

// 点 到 线段 的 距离 

double Dis_point_seg(Point p, Segment v){ 
if(sgn(Dot(p—v.pl,v.p2—v.p1))<0 || sgn(Dot(p—v.p2,v.pl—v.p2))<0) 


// 点 的 投影 不 在 线段 上 
return min(Distance(p,v.p1),Distance(p,v. p2)); 
return Dis_point line(p,v); // 点 的 投影 在 线段 上 
} 
// 求 两 直线 ab 和 cd 的 交点 ,在 调用 前 要 保证 两 直线 不 平行 或 重合 
Point Cross_point(Point a, Point b, Point cv,Point d){ //Linel :ab, Line2:cd 
double sl = Cross(b-a,c—-a); 
double s2 = Cross(b-a,d-a); // 叉 积 有 正 负 


return Point(c.x* s2—d.x*sl,c.y* s2—d.y* s1)/(s2— s1); 
} 
// 两 线段 是 否 相 交 : 1 为 相交 ,0 为 不 相交 
bool Cross_segment (Point a, Point b, Point ¢, Point d){ //Linel :ab, Line2 :cd 
double cl =Cross(b-a,c-a),c2= Cross(b-a,d—a); 
double dl = Cross(d- c,a—c),d2= Cross(d-—c,b-c); 
return sgn(c1) * sgn(c2)<0 && sgn(d1) * sgn(d2)<0; 


// 注 意 交 点 是 端点 的 情况 不 算 在 内 
’ 
//--------------- 平面 几何 : 多 边 形 ---------------- 
struct Polygon{ 
int n; // 多 边 形 的 顶点 数 
Point p[ maxp]; // 多 边 形 的 点 
Line v[maxp]; // 多 边 形 的 边 
}; 
// 判 断 点 和 任意 多 边 形 的 关系 : 3 为 点 上 ; 2 为 边 上 ; 1 为 内 部 ; 0 为 外 部 
int Point_in_polygon(Point pt,Point * p, int n){ // 点 pt, 多 边 形 Point *p 
for(int i = 0;i<n;it+){ // 点 在 多 边 形 的 顶点 上 
if(p[i] == pt)return 3; 
} 
for(int i = 0;i<n;it+){ // 点 在 多 边 形 的 边 上 
Line v= Line(p[il],p[ (i+1)%n]); 
if(Point on_ seg(pt,v)) return 2; 
} 


int num = 0; 

for(int i = 0;i<n;it+){ 
int j = (i+1)% n; 
int c = sgn(Cross(pt ~ p[j],p[li] ~ p[j])); 
intu = sgn(p[i].y - pt.y); 


站 和 人生 二 
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intv = sgn(p[j].y - pt.y); 
if(c>0&&u<0&&v>=0) numtt; 
if(c<0 g& u>=0 &&v<0) num——; 
} 
return num != 0; //1 为 内 部 ; 0 为 外 部 
. 
// 多 边 形 面积 
double Polygon area(Point *p, int n){ // 从 原点 开始 划分 三 角形 
double area = 0; 
for(int i = 0;i<n;it+) 
area += Cross(p[i],p[(i+1)%n]); 
return area/2; // 面 积 有 正 负 ,不 能 简单 地 取 绝 对 值 
// 求 多 边 形 的 重心 
Point Polygon center(Point * p，int n){ 
Point ans(0,0); 
if(Polygon_area(p,n) == 0) return ans; 
for(int i = 0;i<n;it+) 
ans = ans + (p[i] +p[(i+1)%n]) * Cross(p[i],p[(i+1)%n]); 
return ans/Polygon area(p,n)/6.; 
} 
//Convex_hul1() 求 凸 包 . 凸 包 顶 点 放 在 ch 中 ,返回 值 是 凸 包 的 顶点 数 
int Convex_ hull(Point *p,intn,Point *ch){ 


sort(p,p+n); // 对 点 排序 : 按 x 从 小 到 大 排序 , 如果 x 相同 , 按 y 排 序 
n=unique(p,p+n)—p; // 去 除 重复 点 
int v= 0; 


// 求 下 凸 包 . 如 果 p[i] 是 右 拐弯 的 ,这 个 点 不 在 凸 包 上 , 往 回 退 
for(int i=0;i<n;it+){ 
while(v>1 && sgn(Cross(ch[v-1]-ch[v-2],p[i]-ch[v-2]))<=0) 
= 
ch[vt+] = p[i]; 
} 
int j=v; 
// 求 上 凸 包 
for(int i=n-2;i>=0;i--){ 
while(v> j && sgn(Cross(ch[v-1]- ch[v-2],p[il]-ch[v-2]))<=0) 
ss 
ch[v++] = p[i]; 
t 


if(n>1) v—-; 


return v; // 返 回 值 v 是 凸 包 的 顶点 数 
} 
//--------------- 平面 几何 : 加 ---------------- 
struct Circle{ 

Point c; // 圆 心 

double r; // 半 径 

Circle(){} 


Circle(Point c, double r):c(c),r(r){} 
Circle(double x, double y,double _r){c=Point(x,y);r = _r;} 
}; 
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// 点 和 圆 的 关系 : 0 为 点 在 圆 内 ,1 为 点 在 圆 上 ，2 为 点 在 圆 外 
int Point circle relation(Point p, Circle C){ 
double dst = Distance(p,C.c); 
if(sgn(dst - C.r) < 0) return 0; 
if(sgn(dst - C.r) ==0) return 1; 
return 2; 
// 直 线 和 圆 的 关系 : 0 为 直线 在 圆 内 ,1 为 直线 和 圆 相 切 ，2 为 直线 在 圆 外 
int Line circle relation(Line v,Circle C){ 
double dst = Dis point line(C.c,v); 


证 (sgn(dst- C.r) < 0) return 0; // 直 线 在 圆 内 
if(sgn(dst- C.r) == 0) return 1; // 直 线 和 圆 相 切 
return 2; // 直 线 在 圆 外 


// 线 段 和 圆 的 关系 : 0 为 线段 在 圆 内 ，1 为 线段 和 圆 相 切 ，2 为 线段 在 圆 外 
int Seg_circle relation(Segment vv Circle C){ 
double dst = Dis_point_seg(C.cvv); 


if(sgn(dst— C.r) < 0) return 0; // 线 段 在 圆 内 
if(sgn(dst- C.r) ==0) return 1; // 线 段 和 圆 相 切 
return 2; // 线 段 在 圆 外 


下 

// 直 线 和 圆 的 交点 .pa\pb 是 交点 .返回 值 是 交点 的 个 数 

int Line cross circle(Line v Circle C, Point &pa, Point &pb){ 
if(Line circle relation(v, C) == 2) return 0; ”// 无 交点 


Point q = Point_line proj(C.c,v); // 圆 心 在 直线 上 的 投影 点 
double d = Dis point line(C.c,v); // 圆 心 到 直线 的 距离 
doublek = sqrt(C.r*C.r—-dxd); 
if(sgn(k) == 0){ // 一 个 交点 ,直线 和 圆 相 切 
pa = q; 
pb = di/ 
return 1; 
} 
Point n= (v.p2—v.p1)/ Len(v.p2— v.p1); // 单 位 向 量 


pa= q+ nxk; 
pp=q- nxk; 
return 2; // 两 个 交点 


struct Point3{ 
double x,y, 2z; 
Point3(){} 
Point3(double x, double y, double z) :x(x),y(y),z(z){} 
Point3 operator + (Point3 B){return Point3(x+B.x,y+B.y,z+B.z);} 
Point3 operator — (Point3 B){return Point3(x—B.x,y—B.y,z-B.z);} 
Point3 operator * (double k){return Point3(x*k,y*k,zx*k);} 
Point3 operator / (double k){return Point3(x/k, y/k, z/k);} 
bool operator == (Point3 B){ 
return sgn(x 一 B.x) ==0 && sgn(y— B.y) ==0 && sgn(z—B.z)== 0;} 
}; 
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typedef Point3 Vector3; 
// 点 积 . 和 二 维 点 积 函 数 同名 .C++ 人 允许 函数 同名 
double Dot(Vector3 A,Vector3 B){return A.x*B.x+A.y*B.y+A.zx*xB.z;} 
// 叉 积 
Vector3 Cross(Vector3 A,Vector3 B){ 
return Point3(A.y*B.z—A.zx*B.y,A.zx*B.x—A.x*B.z,A.x*B.y— A.y*B.x);} 


double Len(Vector3 A){return sqrt(Dot(A,A));} // 向 量 的 长 度 
double Len2(Vector3 A) {return Dot(A,A);} // 向 量 长 度 的 平方 
double Distance(Point3 A, Point3 B){ //A\B 的 距离 


return sqrt((A.x—B.x)* (A.x—B.x)+ 
(A.y—B.y)* (A.y-B.y)+(A.z—B.z)*x (A.z—B.z)); 
由 
/人 AR 与 B 的 夹 角 
double Angle(Vector3 A, Vector3 B){return acos(Dot(A,B)/Len(A)/Len(B));} 
// 三 维 : 线 
struct Line3{ 
Point3 pl, p2; 
Line3(){} 
Line3(Point3 pl,Point3 p2) :pl(p1),p2(p2){} 
}; 
typedef Line3 Segment3; // 定 义 线段 ,两 端点 是 Point pl,p2 
// 三 维 : 三 角形 面积 的 两 倍 
double Area2(Point3 A,Point3 B,Point3 C){return Len(Cross(B—A, C—A));} 
// 三 维 : 点 到 直线 的 距离 
double Dis_point line(Point3 p, Line3 v){ 
return Len(Cross(v. p2—v.pl,p— v.p1))/Distance(v. pl,v.p2); 
} 
// 三 维 : 点 在 直线 上 
bool Point_line relation(Point3 p,Line3 v){ 
return sgn(Len(Cross(v.pl ~- p,v.p2-p))) == 0 
&& sgn(Dot(v.pl— p,v.p2—p)) == 0; 
} 
// 三 维 : 点 到 线段 的 距离 
double Dis point seg(Point3 p, Segment3 v){ 
if(sgn(Dot(p—v.pl,v.p2—v.p1)) <0 || sgn(Dot(p—v.p2,v.pl—v.p2)) <0) 
return min(Distance(p,v. pl1),Distance(p,v. p2)); 
return Dis_point_line(p,v); 
) 
// 三 维 : 点 p 在 直线 上 的 投影 
Point3 Point_line proj(Point3 p, Line3 v){ 
double k=Dot(v.p2—v.pl,p—v.pl)/Len2(v.p2— v.p1); 
return v.pl + (v.p2—v.pl)*k; 
i 
// 三 维 : 平面 
struct Plane{ 
Point3 pl, p2, p3; // 平 面 上 的 3 个 点 
Plane(){} 
Plane(Point3 pl, Point3 p2, Point3 p3):pl(p1),p2(p2),p3(p3){} 
}; 
// 平 面 法 向 量 
Point3 Pvec(Point3 A,Point3 B,Point3 C){ return Cross(B— A,C— A);} 
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Point3 Pvec(Plane f){return Cross(f.p2—f.pl,f.p3-f.p1);} 


// 四 点 共 平面 

bool Point_on plane(Point3 A,Point3 B,Point3 C,Point3 D){ 
return sgn(Dot(Pvec(A,B,C),D— A)) == 0; 

} 

// 两 平面 平行 


int Parallel (Plane f1, Plane f2){ 
return Len(Cross(Pvec(f£1), Pvec(f2))) < eps; 
| 
// 两 平面 垂直 
int Vertical (Plane f1, Plane f2){ 
return sgn(Dot(Pvec(fl),Pvec(f2))) == 0; 
| 
// 直 线 与 平面 的 交点 p, 返回 值 是 交点 的 个 数 
int Line cross_plane(Line3 uv Plane f,Point3 &p){ 
Point3 v = Pvec(f); // 平 面 的 法 向 量 
double x = Dot(v, u.p2-f£.p1); 
doubley = Dot(v, u.pl-f.p1); 
doubled = x-—y; 
if(sgn(x) == 0 && sgn(y) == 0) return -1; //-1:v 在 f 上 


if(sgn(d) == 0) return 0; //0: v 与 f 平 行 
p= ((u.pl * x)- (u.p2 * y))/d; //1: v 与 f 相 交 
return 1; 

} 

// 四 面体 有 向 体积 x6 


double volume4 (Point3 A,Point3 B, Point3 C, Point3 D){ 
return Dot(Cross(B- A,C— A),D- A);} 


11.5 小 结 


几何 题 是 竞赛 初学 者 的 难关 ,很 多 竞赛 队 甚至 没有 队员 深入 研究 几何 题 ,以 至 于 在 赛场 
上 看 到 几何 题 直接 放弃 。 

几何 题 往往 逻辑 烦琐 ,需要 细致 地 编程 ,很 考验 编码 能 力 。 本 章 提 到 的 内 容 , 竞 赛 队 的 
所 有 队员 都 应 精通 ,并 且 指定 其 中 一 人 深入 研究 ,做 到 能 轻松 解决 中 等 难度 以 上 的 题目 。 
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前 面 各 章节 讲解 了 竞赛 所 需要 的 知识 点 。 在 参赛 之 前 ,队员 有 必要 了 解 ICPC 区 域 赛 
各 赛区 的 总 体 情况 ,并 通过 解读 ICPC 区 域 赛 真题 做 到 心中 有 数 , 确 定 一 个 冲刺 的 目标 。 


历年 的 世界 总 决赛 (World Finals) 题 目 、 区 域 赛 题 目 都 可 以 在 官网 icpc. baylor. edu 浏 
览 和 提交 @。 其 中 ,中 国 大 陆 往 年 的 ICPC 区 域 赛 题目 ,acm. hdu. edu. cn 也 有 收录 。 

在 一 次 区 域 赛 中 ,为 了 区 分 参赛 队员 的 能 力 ,出 题 者 需要 考虑 多 方面 的 因素 才能 出 一 套 
合适 的 题目 。 大 体 上 应 该 能 考查 竞赛 队员 的 5 种 能 力 ,包括 编 码 .计算 思维 .多 辑 推理 、 算 法 
知识 .团队 合作 。 难 度 上 的 区 分 如 表 12. 1 所 示 。 


表 12.1 难度 上 的 区 分 


奖牌 编码 计算 思维 逻辑 推理 算法 知识 团队 合作 总 分 
铜牌 x% x% x% x 9 
银牌 本 本 本 攻关 本 16 
金牌 x 本 本 %% 关 % 关 本 25 


从 能 力 考查 上 看 ,铜牌 1 星 或 2 星 ; 银牌 3 星 或 4 星 ; 金牌 5 星 。 再 考虑 到 铜牌 .银牌 、 
金牌 的 获奖 比例 按 3 : 2 : 1 逐渐 缩小 ,可 以 得 出 结论 : 从 铜牌 提升 到 银牌 比较 容易 ,从 银牌 
提升 到 金牌 很 难 。 

奖牌 和 参赛 队 3 个 队员 的 能 力 直 接 相 关 。 如 果 有 一 人 编码 快 ,做 题 熟练 , 靠 他 一 人 就 可 
以 得 到 铜牌 ; 如 果 3 人 都 能 进行 大 量 训练 ,编码 得 心 应 手 , 算 法 知识 大 量 掌握 ,加 上 一 定 的 
团队 合作 ,可 以 得 到 银牌 ; 在 银牌 的 基础 上 ,如果 3 人 在 平时 训练 中 喜欢 深入 思考 ,不 怕 复 
杂 的 编码 ,把 多 种 算法 和 数据 结构 融会 贯通 ,团队 合作 紧密 , 青 经 历 长 期 的 练习 ,可 以 冲击 
金牌 。 

金牌 .银牌 队员 是 未 来 的 IT 精英 ,铜牌 队员 则 需要 继续 努力 。 


12.1 ICPC 亚洲 区 域 赛 ( 中 国 大 陆 ) 情 况 


每 年 中 国 大 陆 赛 区 有 4 一 6 个 ,每 个 赛区 的 参赛 队伍 有 250 个 左右 ,参赛 学 校 100 多 个 。 
奖牌 设置 比例 是 金牌 10%% .银牌 20%、 铜 牌 30%, 共 60%% 的 参赛 队 得 奖 。 例 如 ,2015 年 、 
2017 年 亚洲 区 域 赛 中 国 大 陆 赛 区 相关 信息 见 表 12. 2 和 表 12. 3。 


Q@ ICPC live archive, 网 上 简称 LA(https://icpcarchive. ecs. baylor. edu/) 。 
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表 12.2 2015 年 亚洲 区 域 赛 中 国 大 陆 赛区 各 站 比赛 情况 统计 


2015 年 长 春 沈阳 合肥 北京 上 海 EC-Final 
题目 数量 13 13 10 天 12 13 
金牌 题 数 5~8 5~8 4~7 7~8 6~9 过 7 
银牌 题 数 4 一 5 4~5 2~4 5~6 5~6 5~7 
铜牌 题 数 4 3 1 4 4~5 3~5 
参赛 队 数 220 172 97 200 199 288 
表 12.3 2017 年 亚洲 区 域 赛 中 国 大 陆 赛区 各 站 比赛 情况 统计 
2017 年 沈阳 西安 青岛 北京 南宁 乌鲁木齐 | EC-Final 
题目 数量 13 1 条 10 区 10 13 
金牌 题 数 6 一 10 6 一 10 3 一 6 5 一 9 8 一 11 7 一 10 9 一 11 
银牌 题 数 5 一 6 4 一 6 有 3 一 5 6 一 7 5~7 6~9 
铜牌 题 数 4 一 5 3 一 4 2 一 3 2 一 3 4 一 6 3~5 4~6 
参赛 队 数 180 350 360 190 228 94 300 


12.2 ICPC 区 域 赛 题目 解析 


2015 年 11 月 22 日 ,亚洲 区 域 赛 上 海 站 于 华东 理工 大 学 举行 ,共有 120 所 We 
大 学 、199 队 参 加 ,来 自 中 国 大 陆 ,中 国 香港 (4 校 7 队 ), 以 及 朝鲜 (1 校 1 队 )、 
蒙古 (1 校 3 队 ) 等 国家 和 地 区 ,是 一 次 典型 的 ` 有 影响 力 的 亚洲 区 域 赛 。 和 

题目 由 电子 科技 大 学 退役 金牌 队员 张 饮 航 、 何 云 脑 拟定 。 题 目 难 度 分 布 入 讲 逢 
合理 ,有 很 好 的 区 分 度 ?。 

本 次 比赛 共 12 道 题目 ,题目 在 ICPC 官网 有 存档 @ ,或 者 在 hdu 上 提交 , 题 号 是 5572 一 
5584。 读 者 在 看 下 面 的 内 容 之 前 ,为 了 更 好 地 理解 题目 ,提高 自己 的 思考 能 力 , 最 好 先 自己 
尝试 做 题 。 

铜牌 : 4 道 或 5 道 题 ,F.K、L、A、B 题 。 

银牌 : 5 道 或 6 道 题 ,加 上 DD 题 。 

金牌 : 6 道 题 以 上 ,加 上 E`.G、I 题 。 

C、H\J 题 有 部 分 做 出 。 

参赛 队 解 题 时 间 (AC 时 间 ) 如 表 12.4 所 示 。 


@ 现场 赛 排名 : https://perma. cc/VJ2A-B642。 
官方 档案 : https://icpc. baylor. edu/regionals/finder/shanghai-2015/standings( 短 网 址 : t. cn/R397ena) 。 
@ https://icpcarchive. ecs. baylor. edu/index. php? option = com_onlinejudge&Itemid = 8& category 一 691( 短 网 
址 : t. cn/R39zGy4)。 
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表 12.4 AC 时 间 ( 分 钟 ,中 位 值 ) 


题 目 F K 并 A B D E G I 
金牌 ( 宇 6 道 ) 六 25 48 101 97 239 | 2290 | 269 270 
银牌 (5 道 或 6 道 ) 8 40 64 140 146 255 | 184 188 
铜牌 (4 道 或 5 道 )| 10 40 98 218 而 5 


下 面 按 难 易 程 度 ,由 简 到 难 对 9 道 题目 进行 详细 的 讲解 。 
12.2.1 F 题 Friendship of Frog(hdu 5578) 


Time Limit: 2000/1000ms(Java/Others) 
Memory Limit: 65536/65536KB(Java/Others)@ 

Problem Description: 

NN 只 青蛙 站 成 一 排 , 它 们 来 自 不 同 的 国家 。 每 个 国家 用 一 个 小 写字 母 表示 。 相 邻 青蛙 
的 距离 (例如 第 1 个 和 第 2 个 青蛙 .第 N 一 1 和 第 N 个 青蛙 等 ) 是 1。 如 果 两 只 青蛙 来 自 同 
一 个 国家 ,那么 它们 是 朋友 。 

距离 最 小 的 一 对 朋友 是 最 亲密 的 。 帮 忙 找 出 这 个 距离 是 多 少 。 

Input: 

第 1 行 是 一 个 整数 了 ,表示 测试 用 例 的 个 数 。 

每 一 个 测试 用 例 只 包括 一 串 长 度 为 N 的 字符 串 ,其 中 第 i 个 字符 表示 第 i 个 青蛙 的 
国籍 。 

Output: 

对 每 个 测试 用 例 ,需要 输出 "Case #x:y", 其 中 并 表示 第 几 个 用 例 , 从 1 开始 计数 ; y 是 
结果 。 如 果 没 有 来 自 同 一 个 国家 的 青蛙 ,输出 一 1。 

Limits: 

1<T<50; 

80% 的 数据 ,1<N<100; 

100% 的 数据 ,1<N<1000; 


字符 串 只 包括 小 写字 母 。 
Sample Input Sample Output 
2 Case #1:2 
abcecba Case #2: 一 1 
abc 

【题解 】 


难度 等 级 : 极 简单 。 本 题 是 所 谓 的 “签到 题 ”, 即 参赛 的 所 有 队伍 都 能 AC 的 简单 题 。 


@ 画 线 表示 只 有 部 分 队伍 做 出 来 。 

加 “Time Limit 和 Memory Limit 是 本 题 的 时 间 和 空间 限制 ,但 是 现场 赛 所 发 的 题目 一 般 不 会 给 出 ,需要 参赛 队 自 己 
判断 是 否 超时 和 超 内 存 。 这 和 在 线 判 题 的 OJ 不 同 ,为 方便 学 习 ,OJ 一 般 会 给 出 这 两 个 参数 。Time Limit 和 编程 语言 也 
有 关系 ,Java 程序 比 C.C++ 程 序 慢 , 所 以 Java 的 Time Limit 更 大 一 些 , 一 般 是 C.C++ 的 3 倍 以 上 。 
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从 读 题 到 提交 代码 ,参赛 队 AC 的 最 短 时 间 (First Blood,FB) 是 3 分 钟 。 铜 牌 队 伍 在 10 分 
钟 左右 AC。 

能 力 考 核 : 编码 能 力 。 

本 题 逻 辑 简 单 ,很 容易 理解 ,不 涉及 复杂 的 算法 ,代码 也 很 短 ,参赛 队员 只 要 了 解 竞赛 的 
入 门 知识 就 能 做 出 来 。 

(1) 时 间 复 杂 度 。 在 读 题 时 ,首先 注意 到 数据 长 度 N 很 小 ,1] 委 N 委 1000, 因 此 可 以 采用 
时 间 复 杂 度 为 OON3 ) 的 算法 。 

(2) 逻辑 和 算法 。 由 于 题目 很 简单 ,首先 想到 暴力 的 方法 。 思 路 是 从 头 开始 检查 第 i 
个 字符 (0 二 i 过 NN) ,逐个 比 对 它 后 面 的 N 一 i 个 字符 ,寻找 相同 的 。 每 次 比 对 时 把 最 短 距离 
记录 下 来 ,直到 全 部 结束 。 其 复杂 度 是 OCN?), 所 以 这 个 方法 是 可 行 的 。 

(3) 扩展 。 

虽然 该 题 是 很 简单 的 题目 ,但 是 如 果 数 据 很 大 ,例如 N 三 105 ,那么 上 述 的 方法 就 会 超 
时 ,此 时 需要 更 好 的 思路 。 

用 暴力 法 结合 “ 剪 枝 ” 的 技巧 可 以 处 理 。 下 面 示例 程序 的 时 间 复 杂 度 是 OCN)。 


#include < bits/stdc++.h> 
using namespace std; 
const int N = 100010; 
char s[N]; 
void solve() { 
scanf("%s", s); 
intn = strlen(s); 
int ans = -1; 
for(int i = 0; i<n; ++i){ // 从 头 到 尾 检查 字符 串 ,i 是 当前 位 置 
for(intj= 1; j<=26 &&i- j>=0;++j){ 
// 剪 枝 技巧 : 由 于 小 写字 符 一 共有 26 个 ,所 以 字符 串 中 两 个 相 
// 同 字符 的 最 小 距离 不 会 超过 26, 只 需要 检查 i 前面 的 26 个 字符 
if(s[i] == s[i - j]){ 
//j 从 1 开始 递增 , 即 从 距离 i 最 近 的 字符 开始 检查 ， 
// 如 果 有 相同 字符 ,就 break; 其 他 未 检查 的 距离 更 大 ,不 用 继续 检查 
if(ans == -1||j<ans){ 
ans = j; 
} 
break; 


} 
j 
printf(" % d\n", ans); 
} 
int main() { 
int t; 
scanf("%d", gt); 
for(int i = 1; i<=t; ++ i){ 
printf("Case # %$d: ", i); 
solve(); 
} 


return 0; 


”319“ 


算法 竞赛 入 门 到 进 阶 


12.2.2 K 题 Kingdom of Black and White(Chdu 5583) 


Problem Description : 

黑白 国有 两 种 青蛙 : 黑 青 蛙 和 白 青 蛙 。N 只 青蛙 站 成 一 行 ,有 些 是 黑 的 ,有 些 是 白 的 。 
计算 青蛙 们 的 合力 ,计算 规则 如 下 : 把 青蛙 们 分 成 最 小 的 部 分 ,每 部 分 是 连续 的 ,只 包含 一 
种 颜色 的 青蛙 ; 合力 是 每 部 分 长 度 的 平方 和 。 

现在 来 了 一 个 罪恶 的 老 巫 婆 , 她 告诉 青蛙 们 ,她 要 改变 青蛙 的 颜色 ,最 多 改变 一 只 。 这 


样 青蛙 们 的 合力 就 变 了 。 
青蛙 们 想 知道 ,巫婆 完成 她 的 工作 后 ,可 能 的 最 大 合力 是 多 少 。 
Input: 


第 1 行 是 一 个 整数 工 , 表 示 测 试用 例 的 个 数 。 

每 个 测试 用 例 只 包含 一 个 字符 串 ,长 度 为 N, 只 包含 字符 '0'( 表 示 一 只 黑 青蛙 ) 和 '1'( 表 
示 一 只 白 青 蛙 ) 。 

Output: 

对 每 个 测试 用 例 ,需要 输出 "Case #x:y", 其 中 x 表示 第 几 个 用 例 , 从 1 开始 计数 ; y 是 
结果 。 

Limits: 

1<T<50; 

60% 的 数据 ,1 二 N 志 1000; 

100% 的 数据 ,1<N<10; 

字符 串 值 包含 0 和 1。 


Sample Input Sample Output 


2 Case #1: 26 
000011 Case #2: 10 
0101 


【题解 】 

难度 等 级 : 简单 题 ,用 暴力 法 求解 。FB 时 间 是 10 分 钟 。 铜 牌 队伍 在 40 分 钟 左 右 AC。 

能 力 考核 : 计算 复杂 度 、 编 码 能 力 。 

本 题 逻 辑 虽然 简单 ,但 是 也 需要 灵活 处 理 ; 不 涉及 复杂 的 算法 ,但 是 需要 了 解 计算 的 复 
杂 度 并 避免 落 入 陷阱 ; 代码 比较 短 ,但 是 有 一 定 的 技巧 。 本 题 可 以 考查 基本 的 计算 思维 和 
较 好 的 编码 能 力 。 

(1) 逻辑 。 根 据 Sample Input 和 Sample Outpnut 理解 题 意 , 当 输入 000011 时 ,青蛙 的 
合力 是 和 十 2 一 20。 改 变 一 只 青蛙 的 颜色 ,例如 改 成 000001 ,合力 变 为 时 十 卫 王 26。 判 断 
最 大 的 合力 是 26 ,并 输出 。 

可 能 的 最 大 合力 ,出 现在 有 N= 二 10” 只 青蛙 的 情况 下 , 且 所 有 青蛙 是 一 种 颜色 ,此 时 合 
力 是 N: 一 10 一 24 ,可 以 用 64 位 的 long long 类 型 表示 。 

(2) 计算 复杂 度 。 在 解 题 时 ,首先 应 该 注意 数据 的 规模 , 即 1 二 N105 ,这 说 明 不 能 使 
用 时 间 复 杂 度 大 于 OCN? ) 的 算法 。 
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算法 竞赛 的 初学 者 ,如 果 没 有 注意 到 这 一 限制 ,就 会 落 入 陷阱 ,用 以 下 简单 的 暴力 方法 ， 
结果 是 TLE: 每 改变 一 只 青蛙 的 颜色 ,就 重新 计算 合力 ,计算 量 是 OCN); 从 头 到 尾 一 共 可 


以 改变 N 次 ; 总 复杂 度 是 OCN?)。 


TLE 的 错误 代码 
# include < bits/stdc++.h> 
using namespace std; 
const intN = 100010; 
char s[N]; 
int n; 
long long get_ans() { // 计 算 合力 ,时 间 复 杂 度 是 0(N) 


long long ans = 0; 


int cur = -1, len = 0; 
for(int i = 1; i<=n; ++ i){ 
if(s[i] - '0' == cur) 

++ len; 
else { 


ans += 1LL * len * len; 


len = 1; 
oe = W's 
} 
: 
ans += 1LL * len * len; 
return ans; 


} 

void solve() { 
SEC 
n= strlen(s + 1); 
long long ans = get ans(); 


for(int i = 1; i<=n; ++ i)f{ 
s[i] = 1'+ '0'— s[i]; 


// 总 的 时 间 复杂 度 是 0( 玉 ), 结 果 TLE 


// 逐 个 改变 青蛙 的 颜色 ,可 以 改变 N 次 
// 改 变 当 前 青蛙 的 颜色 


ans = max(ans, get_ans());  // 计 算 合 力 并 得 到 最 大 值 


0 = 


! 

printf("% 1ld\n", ans); 
上 
int main() { 

汪汪 二 

scanf("%d", &t); 


for(int i = 1; i<=t; ++ i){ 


// 还 原 青蛙 的 颜色 


printf("Case # %d: ", i); 


solve(); 


$ 
return 0; 


} 


(3) 优化 和 解决 。 在 上 述 程 序 中 ,计算 复杂 度 可 以 优化 。 每 次 改变 一 只 青蛙 的 颜色 后 ， 
因为 只 影响 了 相 邻 的 青蛙 序列 ,所 以 并 不 需要 全 部 重新 计算 ,只 计算 被 影响 的 这 部 分 就 行 
了 。 这 样 ,每 改变 一 只 青蛙 的 颜色 ,计算 的 时 间 复 杂 度 差不多 是 O(1) ,总 复杂 度 是 OCN) 。 
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正确 代码 


#include < bits/stdc++.h> 
using namespace std; 
const intN = 100010; 
#define square(x) (x)* (x) 
void solve() { 
9 
char s[N]; 
int n; 
long long a[N] = {0}; 
long long maxsum, oldsum = 0; 
scanf(" %s", s + 1); 
n= strlen(s + 1); 
for(i=2; i<=n; i++)f // 把 表示 青蛙 序列 的 "01" 字 符 串 改 成 数字 , 例如 
// 把 "000011001" 改 成 数字 4221, 并 存放 在 数组 a[ ] 中 , 处 理 起 来 更 加 便捷 
if(s[il]==s[i-1]) 


j++; 
else { 
alk]=j; 
k++ ; 
j=1; 
} 
} 
a[k] = ji 
for(i=1; i<=k; i++)f // 计 算 改变 颜色 前 的 合力 
oldsum = oldsum + a[i]xa[i]; 
1 
maxsum = oldsum; 
for(i=1; i<=k; i++){ // 改 变 一 只 青蛙 的 颜色 对 合力 的 影响 
// 只 需要 考虑 以 下 两 种 情况 : 
if(a[i] ==1) // 如 果 长 度 是 1, 说 明 这 只 青蛙 是 孤立 的 ， 


// 改 变 它 的 颜色 后 ,可 以 和 左右 合并 ， 
// 例 如 "00100" 合 并 成 "00000" 
maxsum = max(maxsum, oldsum+ square(a[i—1]+a[i]+a[i+1])- square(a[i-1])- 
square(a[i]) - square(a[i+1])); 
if(a[i]>=2){ // 如 果 长 度 大 于 等 于 2, 可 以 分 两 次 改变 颜色 : 

// 改 变 最 左边 的 ,与 左边 的 邻居 合并 ,例如 "0110" 改 成 "0010"; 

// 改 变 最 右边 的 ,和 右边 的 邻居 合并 ,例如 "0110" 改 成 "0100" 

// 如 果 长 度 大 于 等 于 3, 改变 中 间 的 , 只 会 减 小 合力 ， 

// 所 以 不 用 考虑 ,例如 "01110" 改 成 "01010", 合力 变 小 


maxsum = max(maxsum, oldsum+ square(a[i—1] +1)+square(a[i] -1) - square(a[i-— 


1]) - square(a[i])); // 给 左边 
maxsum = max(maxsum, oldsum + square(a[i+1]+1)+square(a[i]-1)- square(a[i+ 
1]) - square(a[i])); // 给 右边 
} 
} 


printf("% 1ld\n", maxsum); 
} 


int main() { 
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人 

scanf("%d", gt); 

for(lint i = 1;i<=t;++1i)1{ 
printf("Case # %d: ", i); 
solve(); 

} 


return 0; 


12.2.3 L 题 LCM Walk(hdu 5584) 


Problem Description: 

一 只 青蛙 刚 学 会 一 些 数论 就 迫不及待 地 想 展示 给 女 朋 友 看 。 

它 坐 在 一 个 网 格 图 上 , 行 和 列 都 是 无 限 的 。 行 的 计数 从 底部 开始 , 列 也 是 这 样 。 青 蛙 最 
初 的 位 置 是 坐标 (sz ,s,) ,旅程 开始 了 。 

为 了 向 女 朋 友 炫 炮 它 的 数学 天 才 , 它 使 用 了 一 种 特别 的 跳跃 方法 。 如 果 它 在 坐标 
(zx,y) 上 ,寻找 一 个 可 以 被 x 和 > 都 整除 的 最 小 的 = ,然后 向 上 或 向 右 跳 = 步 ,下 一 步 坐标 可 
能 是 (z 十 =,y) 或 (zy 十 =) 。 

经 过 有 限 次 跳跃 后 (可 能 是 0 步 ), 它 停 在 (ex,ey) 处 。 然 而 它 太 累 了 ,忘记 了 它 的 起 始 
位 加 ; 

如 果 一 个 个 去 检查 网 格 的 所 有 坐标 , 那 太 笨 了 ! 请 告诉 青蛙 一 个 聪明 的 办 法 ,到 达 
(ez ,ey) 的 可 能 的 起 始 位 置 有 多 少 个 ? 

Input: 

第 1 行 是 一 个 整数 工 ,表示 测试 用 例 的 个 数 。 

每 个 测试 用 例 包含 两 个 整数 ex .ey, 即 目的 地 坐标 。 

Output: 

对 每 个 测试 用 例 ,需要 输出 "Case # x: y", 其 中 工 表 示 第 几 个 用 例 , 从 1 开始 计数 ; y 
是 可 能 起 点 的 个 数 。 

Limits: 

1<T<1000; 

1<e, ,ey,<10’。 


Sample Input Sample Output 


3 Case #1: 1 
610 Case #2:2 
68 Case 井 3: 3 
28 


【题解 】 

难度 等 级 : 简单 题 ,数学 。FB 时 间 是 18 分 钟 。 铜 牌 队伍 在 98 分 钟 左右 AC。 

能 力 考核 : 数论 中 的 最 小 公 倍数 和 最 大 公约 数 问题 ,逻辑 推理 。 

本 题 涉及 了 算法 知识 ,不 过 比较 容易 ,是 简单 的 数论 概念 ; 推导 过 程 需 要 有 清晰 、 灵 活 
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的 推理 ; 需要 了 解 计算 的 复杂 度 ; 代码 比较 短 。 本 题 可 以 考查 基本 的 算法 知识 和 一 定 的 轴 
辑 推理 能 力 。 

(1) 算法 复杂 度 。 在 解 题 时 ,首先 应 该 注意 数据 的 规模 , 即 1<e, ,e, 硅 10 ,这 说 明 不 能 
使 用 时 间 复 杂 度 大 于 OCN) 的 算法 。 

(2) 算法 概念 和 逻辑 推理 。 标 题 说 明 这 是 一 个 LCM( 最 小 公 售 数 ) 问 题 。 


z 是 zx,y 的 LCM ,假设 z=pi,y= 二 gt,z 二 pqt。p 和 g 互 质 。 

起 点 (z,y) ,下 一 步 可 以 走 到 两 个 位 置 (z,y 十 x) 或 (x 十 z,y) ,下 面 分 别 讨论 。 

@ 终点 (ez ,ey)= 二 (x,y 十 z)= 二 (pt,qt+pgqt)=(pt,q(l 二 +p)1)。 

由 于 p 和 g(1l 十 p) 互 质 ,所 以 1 是 最 大 公约 数 ,可 得 1 二 GCD(e,,e,)。 推 导 得 到 起 点 : 


T= pt=ey 


?3 一 gt 一 ex/ (ez 十 1 
这 是 一 个 可 能 的 起 点 。 
把 起 点 当成 新 的 终点 ,继续 这 个 过 程 ,直到 结束 。 
需要 注意 ,p,q\t 都 是 整数 ,在 程序 中 需要 判断 。 
@ 终点 (ez ,ey) 二 (zx 十 x,y)。 
实际 情况 和 @ 类 似 。 注 意 到 @ 中 y 十 x 二 zx, 即 e, 过 e,,@ 中 e.>ey。 在 编程 时 ,只 需要 
先 按 大 小 交换 es .ev 的 顺序 ,就 可 以 合并 成 一 种 情况 处 理 了 。 


#include <bits/stdc++.h> 
int solve(long long ex, long long ey) { 
int ans = 1; 
long long t; 
while (true) { 
if (ex > ey) 
std: :swap(ex, ey); 
t = std::_ gcd(ex, ey); 
//p = ex /t; q= ey/(ex+t); // 在 计算 中 p 和 9g 并 未 用 到 


if ((ey % (ex+t)) == 0){ // 判 断 q 是 否 为 整数 ; t 和 pp 肯定 是 整数 ,不 用 判断 
ey = ey*t/(ex+t); 
anst+; 
else 
break; 
} 
return ans; 


上 
int main() { 
i 
long long ex, ey; 
scanf("%d", &T); 
for (int cas = 1; cas <=T; cas++) { 
scanf(" % 1ld% 1ld", &ex, &ey); 
printf("Case # %d: %d\n", cas, solve(ex, ey)); 
} 


return 0; 
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12.2.4 A 题 An Easy Physics Problem(hdu 5572) 


Problem Description: 

在 一 个 无 限 光滑 的 桌面 上 有 一 个 固定 的 大 圆柱 体 , 还 有 一 个 体积 忽略 不 计 的 小 球 。 

开始 时 , 球 静 止 于 A 点 ,给 它 一 个 初始 速度 和 方向 ,如 果 球 撞 到 圆柱 体 , 它 会 弹 回 ,没有 
能 量 损失 。 

经 过 一 段 时 间 ,小 球 是 否 会 经 过 已 点 ? 

Input: 

第 1 行 是 一 个 整数 工 ,表示 测试 用 例 的 个 数 。 

每 个 测试 用 例 有 3 行 。 

第 1 行 有 3 个 整数 Ox、Oy、r。 圆 柱 体 的 中 心 是 (Ox,Oy) ,半径 为 ~。 

第 2 行 有 4 个 整数 Ax、.Ay、Vx、Vy。A 的 坐标 是 (Ax,Ay) ,初始 方向 矢量 是 (Vx,Vy) 。 

第 3 行 有 两 个 整数 Bx、.By。B 的 坐标 是 (Bx,By)。 

Output: 

对 每 个 测试 用 例 ,需要 输出 "Case #x: y" ,其 中 工 表示 第 几 个 用 例 , 从 1 开始 计数 ; 如 
果 球 会 经 过 B 点 ,y 是 "Yes" ,否则 > 是 "No" 。 

Limits: 

1<T<100; 

|Ox| ,|Oy|1000; 

1<r<100; 

[IAx|,|Ay|,|Bx|,|By|<1000; 

IVx|,|Vy|1000; 

Vx 关 0 或 Vy 考 0; 

A 和 B 都 在 圆柱 体 的 外 面 ,而 且 不 重合 。 


Sample Input Sample Output 


2 Case #1: No 
001 Case #2: Yes 
2201 

一 下 = 

001 

= 

12 


【题解 】 

难度 等 级 : 中 等 题 , 几 何 。FB 时 间 是 38 分 钟 。 铜 牌 队伍 在 220 分 钟 左 右 AC。 

能 力 考核 : 逻辑 思维 、 较 强 的 编码 能 力 。 

本 题 代 码 较 长 ,逻辑 较 复杂 ,但 是 很 容易 理解 ,也 不 涉及 复杂 的 算法 。 这 种 题 是 考查 编 
码 能 力 的 典型 题目 ,在 编码 时 需要 认真 处 理 几 何 模板 、 逻 辑 关 系 等 。 

本 题 的 代码 已 经 在 11. 2. 1 节 中 作为 例题 详细 给 出 。 
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12.2.5 B 题 Binary Tree(hdu 5573) 


Problem Description : 

青蛙 国王 住 在 一 个 无 限 长 的 树 的 根部 。 根 据 法 律 ,每 个 结 点 应 该 连接 下 一 层 的 两 个 结 
点 ,构成 一 个 完整 的 二 又 树 。 

因为 国王 的 数学 很 牛 , 它 为 每 个 结 点 配置 了 一 个 数字 。 特 别 地 , 树 的 根 就 是 国王 住 的 地 
方 ,是 1, 记 为 froot 二 1。 对 每 个 结 点 ,标签 是 fu, 左 子 结 点 是 fuX2, 右 子 结 点 是 fuX2 十 1。 
国王 对 它 的 树 王国 很 满意 。 

时 间 流 逝 , 国 王 病 了 。 根 据 黑 魔法 ,如 果 国 王 能 收集 N 个 幽灵 宝石 ,可 以 让 它 再 活 N 
年 。 开 始 时 ,国王 位 于 根部 ,幽灵 宝石 的 数量 是 0, 然 后 它 往 下 走 ,每 次 往 左 子 结 点 或 右 子 结 
点 走 。 在 结 点 工 处 ,这 个 结 点 的 数字 是 广 ( 记 住 froot=1) , 它 可 以 选择 把 幽灵 宝石 增加 广 
或 者 减少 广 。 它 从 根部 开始 走 ,访问 K 个 node( 包 括 根 结 点 ) ,在 每 个 结 点 处 加 或 者 减 去 上 
述 的 数字 。 如 果 数 字 最 后 是 N, 它 就 成 功 了 。 注 意 幽 灵 宝 石 有 魔法 ,幽灵 宝石 的 数字 N 可 


能 是 负数 。 
给 定 n、K ,帮助 国王 收集 个 幽灵 宝石 ,不 多 不 少 访问 K 个 结 点 。 
Input: 


第 1 行 是 一 个 整数 工 ,表示 测试 用 例 的 个 数 。 

每 个 测试 用 例 包括 两 个 整数 入, 即 国王 要 收集 的 幽灵 宝石 的 数量 、 访 问 的 结 点 
数量 。 

Output: 

对 每 个 测试 用 例 , 先 输出 "Case #x:", 其 中 xz 表示 第 几 个 用 例 ,从 1 开始 计数 。 

下 面 有 开行 ,每 一 行 'a b': a 是 青蛙 访问 的 结 点 标签 ;5 是 ' 十 ' 或 ' 一 ', 表 示 加 或 减 a。 

保证 至 少 有 一 个 结果 成 立 , 如 果 有 很 多 成 立 , 可 以 输出 任何 一 个 。 


Limits: 
1<T<100; 
1<n<10"; 
人 
Sample Input Sample Output 
2 Case #1: 
53 外 
10 4 = 
中 本 
Case #2: 
VV 
3 二 
2 
98 十 
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【题解 】 

难度 等 级 : 中 等 题 , 模 拟 题 .构造 。FB 时 间 是 44 分 钟 。 铜 牌 队伍 在 213 分 钟 左右 AC。 

能 力 考核 : 计算 思维 .逻辑 思维 。 

本 题 不 需要 复杂 的 算法 ,编码 也 不 长 ,但 是 需要 灵活 处 理 , 找 到 间接 的 解决 方案 。 这 是 
典型 的 考查 思维 能 力 的 题目 ,具体 是 考查 对 二 进 制 的 领 司 能力。 这 种 思维 能 力 需要 聪明 的 
头脑 和 长 期 的 编程 训练 。 

首先 考虑 计算 复杂 度 。 本 题 如 果 用 暴力 的 方法 ,简单 地 罗列 所 有 可 能 的 走 法 是 不 行 的 。 
从 第 1 层 根 结 点 走 到 第 K 层 , 一 共有 2 一 :个 路 径 , 由 于 每 个 结 点 上 可 取 正 负 , 那 么 每 个 路 径 
上 又 有 2* 种 组 合 , 合 起 来 大 概 是 4* ,而 K 三 60, 肯 定 会 TLE。 

类 似 这 种 题目 ,灵机 一 动 ? 非 常 重要 。 比 如 本 题 的 思路 是 只 要 一 直 沿 着 最 左边 (加 上 第 
K 层 最 左边 的 右 子 结 点 ) 走 到 第 K 层 , 就 能 找到 一 个 答案 。 知 道 了 这 一 点 ,后 面 就 简单 了 。 
虽然 题目 中 的 限制 条 件 n2* 给 出 了 暗示 ,但 是 想到 这 一 点 仍然 很 难 。 这 也 是 为 什么 平时 
做 题 训练 时 尽量 不 要 看 题解 ,而 是 应 该 多 自己 思考 ,锻炼 思维 能 力 。 如 果 靠 看 别人 的 题解 知 
道 这 个 方法 ,然后 再 去 完成 编码 ,收获 是 很 小 的 。 


上 述 思路 证 明 如 下 ; 
(1) 二 又 树 最 左边 的 那 条 边 , 从 上 到 下 相 加 ,满足 条 件 wn 三 2*。 从 第 1 层 沿 着 最 左边 走 
1 中 路 径 是 1-2-4-8), 最 大 值 是 ?一 2 十 2 十 22 十 2 十 24 十 … 十 2K-1 


“一 1, 如 果 在 第 K 层 选择 最 左边 的 右 子 结 点 (图 12. 1 中 路 径 是 1-2-4-9) ,那么 最 大 值 是 
a 


图 12.1 B 题 


(2) 对 于 给 定 的 天, 沿 着 最 左边 走 (最 后 一 层 可 以 走 右 边 ) 可 以 实现 1<n<2* 中 的 所 有 
值 ,也 就 是 对 任何 都 能 找到 一 个 答案 。 请 自己 证 明 。 下 面 用 一 个 例子 来 说 明 : 令 K=5， 
最 左边 的 数 依次 是 1,2,4,8,16。 最 大 n= 二 32, 现 在 证 明 1 一 32 中 所 有 的 数 都 能 用 1,2,4,8， 
16( 最 后 一 层 可 以 走 右 边 ) 的 组 合 获得 。 实 际 上 ,一 直 走 左边 可 以 得 到 奇数 ,然后 在 最 后 一 层 
走 右边 能 得 到 偶数 ,所 以 只 需要 考虑 奇数 就 行 了 。 

31 二 16 十 8 十 4 十 2 十 1。 联 想到 31 的 二 进 制 表示 : 31 二 11111,; 用 11111 表示 这 条 路 
径 , 其 中 1 表示 ' 十 ',0 表示 ' 一 '。 

29 王 16 十 8 十 4 十 2 一 1,29 王 31 一 2, 把 上 面 16 十 8 十 4 十 2 十 1 中 的 十 1 变 成 一 1 即 可 。 用 
11110 表示 这 条 路 径 。11110 可 以 这 样 计算 得 到 : 31 一 (31 一 29)/2 王 30 王 11110， 。 

27 王 16 十 8 十 4 一 2 十 1,27 一 31 一 4, 把 十 2 变 成 一 2,2 的 二 进 制 是 10。。 用 11101 表示 这 
条 路 径 ,31 一 (31 一 27)/2 一 29 一 11101， 。 
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25 王 16 十 8 十 4 一 2 


条 路 径 ,31 一 (31 一 25)/2 一 28 一 11100， 。 


1,25 二 31 一 6, 把 十 3 变 成 一 3,3 的 二 进 制 是 11* 。 用 11100 表示 这 


23 王 16 十 8 一 4 十 2 十 1,23 王 31 一 8, 把 十 4 变 成 一 4; 用 11011 表示 这 条 路 径 。 


2 一 16 十 8 一 4 十 2 


1,21 


每 个 奇数 都 能 实现 。 
在 编程 时 ,结合 二 进 制 的 特点 ,很 容易 写 出 程序 。 其 复杂 度 为 O(K)。 


31 一 10, 把 十 5 变 成 一 5; 用 11010 表示 这 条 路 径 。 


# include <algorithm > 


typedef long long LL; 


int main(){ 


int num, n, K, odd; 
scanf(" %d"”, &num); 


for(int i = 1; i<=num; ++i){ 
scanf("%ds%d", &n, &K); 


if(n % 2) 


//n 是 奇数 ,每 一 层 都 是 最 左边 的 数 
//n 是 偶数 ,转换 为 比 它 小 1 的 奇数 处 理 。 最 后 一 层 取 右边 的 数 


LL pp= (LL)pow(2,K) -1; 
// 二 进 制 数 为 全 1 的 数 。 例 如 K= 5 时 ,pp = 31, 二 进 制 是 11111 
Lkk = pp- (pp-n)/2;  //kk 的 二 进 制 表示 ,就 是 一 个 可 行 的 路 径 。 


LL pos = 0 


// 其 中 为 1 的 是 '+ ', 为 0 的 是 '-'。 原 因 见 上 文 的 证 明 
// 当 前 层 数 ,从 国王 的 顶层 开始 


printf("Case # %d:\n", i); 


while(kk > 1) { 


if(kk & 1) 


// 不 处 理 最 后 一 层 ,最 后 一 层 有 奇偶 问题 
// 二 进 制 数 的 个 位 数 是 当前 的 层 
// 这 个 位 置 是 '1', 表示 要 加 


printf("% 1ld %c\n", (LL)pow(2,pos), '+"'); 


else 


// 二 进 制 数 的 个 位 数 是 '0', 表示 要 减 


printf("%1ld %c\n", (LL)pow(2,pos), '—'); 


kk = kk >>1; 


Post+; 


// 二 进 制 数 右 移 一 次 ,把 处 理 过 的 移 走 
// 新 的 个 位 数 是 下 一 层 


// 下 面 处 理 最 后 一 层 。 如 果 n 是 偶数 ,最 后 一 层 取 右边 


if(kk & 1) 


printf("%1ld %c\n", (LL)pow(2,pos) + odd, '+'); 


else 


printf("%1ld %c\n", (LL)pow(2,pos) +odd, '— '); 


} 


return 0; 


12.2.6 D 题 Discover Water Tank(hdu 5575) 


Problem Description: 
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水 箱 里 面 住 着 很 多 青蛙 ,但 是 它们 都 不 知道 水 箱 里 有 多 少 水 。 

水 箱 的 高 度 无 限 , 但 是 底部 狭窄 。 水 箱底 部 长 N, 宽 只 有 1。 

NN 一 1 个 板子 把 水 箱 隔 成 N 部 分 ,每 部 分 底部 大 小 是 1X1, 板 子 的 高 度 不 同 。 水 不 能 
穿 过 板子 ,但 是 如 果 水 平面 比 板子 高 .根据 基本 的 物理 规律 ,水 会 从 板子 上 面 漫 过 去 。 

青蛙 国王 想 知道 水 箱 的 细节 , 它 派 人 选择 了 M 个 点 ,看 这 些 点 上 有 没有 水 。 

例如 ,每 次 它 选择 (x,y) ,表示 在 水 箱 的 第 xz 部 分 (1 三 x 三 N, 从 左 到 右 计 数 ) ,在 高 度 
(y 十 0.5) 的 地 方 检查 是 否 有 水 。 

国王 得 到 了 M 个 结果 ,但 是 它 发 现 有 些 可 能 是 错 的 。 国 王 想 知道 正确 结果 的 最 大 可 能 
个 数 有 和 多少。 

Input: 

第 1 行 是 一 个 整数 工 , 表 示 测 试用 例 的 个 数 。 

每 个 测试 用 例 的 第 1 行 是 两 个 数 N 和 M, 即 水 箱 隔 成 N 部 分 .测量 M 次 。 

每 个 测试 用 例 的 第 2 行 包括 N 一 1 个 整数 , 即 hl ,hs,…,hv-i,hi 表示 第 i 个 板子 的 
高 度 。 

下 面 有 M 行 ,第 i 行 的 格式 为 'x y z", 表 示 测 量 结果 。 如 果 第 z 个 水 箱 高 (> 十 0.5) 处 没 
有 水 ,那么 一 0, 和 否则 = 一 1。 

Output: 

对 每 个 测试 用 例 ,需要 输出 "Case # x: y", 其 中 xz 表示 第 几 个 用 例 , 从 1 开始 计数 ; y 
是 正确 结果 的 最 大 可 能 数字 。 

Limits: 

1<T<100; 

90% 的 数据 ,1 志 N<1000,1<M<2000; 

100% 的 数据 ,1<N<10,1<M<2X105; 

1<h:<10 ,1<i<N—1; 

对 每 个 结果 ,1 委 z 委 N,1 委 > 委 10! ,= 是 0 或 1。 


Sample Input Sample Output 
2 Case #1:3 
34 Case #2:1 
34 
131 


【题解 】 
难度 等 级 : 难题 ,综合 。FB 时 间 是 119 分 钟 。 金 牌 队伍 在 240 分 钟 左右 AC ,银牌 有 少 
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数 队伍 做 出 。 

能 力 考 核 : 高 级 数据 结构 ( 左 偏 树 )、STL 库 .逻辑 思维 、 编 码 能 力 。 

本 题 有 复杂 的 逻辑 ,大 规模 的 数据 ,需要 结合 数据 结构 、 算 法 、STL 库 , 是 典型 的 难题 ， 
综合 考查 逻辑 .算法 ,编码 等 多 方面 的 能 力 。 

(1) 计算 复杂 度 。 读 题 时 首先 应 注意 到 本 题 较 大 的 数据 规模 , 即 板子 的 数量 1 NN 
105 ,以 及 测量 的 个 数 1 三 M2X105 ,因此 计算 复杂 度 比 OCNMD) 小 。 

(2) 理解 题目 。 

图 12. 2 是 第 1 个 测试 样 例 。 图 中 'X ' 表 示 无 水 , 即 z===0; 'O' 表 
示 有 水 , 即 x 二 1。 在 这 个 例子 中 ,最 大 的 正确 数字 是 3, 即 第 1 个 水 


箱 的 测量 结果 是 错 的 ,后 面 3 个 结果 都 是 对 的 。 | 
本 题 的 解决 思路 是 比较 清晰 的 , 即 从 低 到 高 ,逐渐 给 水 箱 加 水 ， x 
然后 计算 正确 的 测量 个 数 。 步 又 如 下 ， 
@ 从 假设 水 箱 没有 水 开始 ,此 时 'X ' 的 个 数 就 是 答案 , 记 为 ans。 图 12 2 D 是 


@ 逐一 检查 每 个 'O' 的 有 水 记录 , 即 给 这 个 水 箱 加 水 ,直到 这 个 记 
录 的 高 度 。 可 以 想到 , 按 从 低 到 高 的 顺序 检查 所 有 的 'O', 迎 辑 上 是 正确 的 ,而 且 比较 简单 。 

@ 上 一 步 中 对 每 个 'O"' 的 检查 ,加 水 到 'O"' 的 高 度 后 , 它 可 能 向 左 .向 右 溢出 。 检 查 被 它 
溢出 的 水 箱 ,在 当前 水 位 高 度 下 有 多 少 'X'? 有 多 少 '0'?'0' 的 数量 减 去 'X ' 的 数量 , 差 值 为 
d ,更 新 ans,ans 二 ans 十 d。 

@ 检查 完 所 有 'O', 输 出 ans。 

在 以 上 思路 中 ,@ 是 最 关键 的 。 检 查 每 个 'O0' 向 左 、 向 右 的 溢出 ,复杂 度 是 O(N); 一共 
有 M 个 '0', 总 复杂 度 是 OCMN)。 而 1 二 N10 ,1 二 M2X105 ,OCMN) 很 大 ,显然 不 能 用 
暴力 的 方法 去 检查 每 个 'O' 的 溢出 。 那 么 怎么 做 呢 ? 因 为 是 按 从 低 到 高 的 顺序 检查 'O', 在 检 
查 更 高 的 'O' 时 ,前 面 检查 过 的 、 相 邻 水 箱 的 、 较 低 的 'O' 的 检查 结果 可 以 直接 拿 来 用 。 或 者 
说 ,一 些 相 邻 的 水 箱 可 以 合并 为 一 个 大 水 箱 。 

当 水 向 左 、 向 右 溢 出 以 后 ,被 溢出 到 的 小 水 箱 合并 成 一 个 大 水 箱 , 这 样 OCOM) 次 枚 举 'O' 
的 复杂 度 就 是 O(N) ,而 不 是 OCMN) 了 。 

在 合并 的 时 候 , 不 仅 要 合并 当前 水 位 之 下 的 'O' 和 'X' 的 数量 ,还 要 维护 大 水 箱 的 左右 
两 边 是 哪些 水 箱 以 及 是 哪些 挡 板 。'O"' 的 数量 可 以 看 当前 枚 举 了 多 少 0,'X ' 的 数量 可 以 用 一 
个 能 表示 顺序 的 数据 结构 来 维护 ,这 个 数据 结构 维护 结构 体 (z,y) 表 示 'X ' 在 坐标 为 (z,y) 的 
位 置 。 在 计算 第 z 个 小 水 箱 的 水 位 h 下 的 'X' 的 时 候 , 可 以 在 删除 数据 结构 最 小 元 素 的 同时 
计数 ,直到 y 三 h( 即 最 低位 置 的 'X ' 在 水 位 之 上 ) 为 止 。 维 护 顺序 的 数据 结构 可 以 用 堆 或 者 
平衡 树 , 但 是 又 需要 数据 能 够 快速 地 合并 ,因此 使 用 由 左 偏 树 实现 的 可 并 堆 。 

概括 起 来 , 解 题 过 程 是 以 x 二 0 的 测量 总 数 为 初始 答案 ,通过 枚 举 z==1 的 情况 来 更 新 答 
案 , 维 护 水 箱 并 处 理 水 箱 的 合并 ,用 左 偏 树 实现 的 可 并 堆 来 处 理 水 箱 的 合并 及 计算 单 次 枚 举 
的 答案 。 总 的 复杂 度 是 O(NlogN 十 NlogM)。 

下 面 是 出 题 人 提供 的 代码 。 


#include < bits/stdc++.h> 
using namespace std; 
const int N = 200100; 


= 330。 


第 12 章 ”ICPC 区 域 赛 真题 


const int INF = 2000000000; 
int n, m, h[N], st[N], wh[N], height[N * 2], val[N * 2][2], dp[N * 2][2]; 
int lca[N * 2][18], dep[N * 2]; 
vector < int > pos[2], off[2], high[N * 2][2]; 
vector < int > edge[2 * N]; 
void clear(){ 
for(int i = 0; i<=n; ++ i){ 
edge[il].clear(); 
high[i][0].clear(); high[i][1].clear(); 
. 
pos[0].clear(); off[0].clear(); 
pos[1].clear(); off[1].clear(); 
} 
void pre dfs(int u, int fa, int dist) { 
lca[u][0] = fa; dep[u] = dist; 
for(int i = 1; i<18; ++ i) 
lca[lu][i] = lca[lca[ul[i- 1]][i - 1]; 
for(int i = 0; i< edge[u]. size(); ++ i){ 
int v = edge[u][i]; 
pre dfs(v, u, dist + 1); 
} 
} 
int get node(int x, int y) { 
for(inE td = 1 425s0 == 
if(dep[x] > (1 << i) && height[1ca[x][i]] <=y) 
x = lca[lx][i]; 
return x; 
. 
void add_edge(int x, int y) { 
edge[x]. push_back(y); 
. 
void build tree() { 
int tot = n, top = 0; 
h[n] = INF;height[0] = INF; 
for(int i = 1; i<=n; ++ i){ 
height[i] = 0; val[i][0] = val[il[1] = 0; 
wh[top] = i; 
while(top > 0 && st[top - 1] <h[i]) { 
++ tok; 
height[tot] = st[top - 1]; 
val[tot][0] = val[tot][1] = 0; 
int tid = top 一 3 
add_edge(tot, wh[top]); 
while(top > 0 && st[top - 1] == st[tid]){ 
一 top; 
add_edge(tot, wh[top]); 


} 

wh[top] = tot; 
} 
st[top ++] = h[i]; 
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n= tot; 
for(int i = 0; i<18; ++ 1) 
lca[0][i] = 0; 
pre dfs(n, 0, 1); 
for(int i = 0; i<2; ++ i){ 
for(int j = 0; j < pos[i].size(); ++ j) { 
int id = get_node(pos[i][j], off[i][j]); 
val[id][i] ++; high[id][i].push back(off[i][j]); 


+? 
; 
void dfs(int u) { 
dp[u][0] = val[u][0]; 
dp[u][1] = val[u][1]， 
sort(high[u][0]. begin(), high[u][0].end()); 
sort(high[u][1]. begin(), high[u][1].end()); 
intp = 0, ret = 0; 
for(int i = 0; i<val[u][0]; ++ i){ 
while(p < val[u][1] && high[u][1][p] < high[u][0][i]) 
++ p; 
ret = max(ret, p + val[u][0] - i); 
上 
int flag = val[u][0], Mind = INF; 
for(int i = 0; i< edge[u].size(); ++ i) { 
int v = edge[u][i]; 
dfs(v); 
dp[u][1] += dp[v][1]; 
dp[u][0] += max(dp[v][0], dp[v][1]); 
} 
dp[u][0] = max(dp[u][0], dp[u][1] - val[u][1] + ret); 
} 
void solve() { 
scanf("%d%d", &n, Sm); 
for(int i = 1; i<n; ++ i) 
scanf("%d", h + i); 
for(int i = 1; i<=m; ++ i){ 
de 
scanf("%d%d%d", &x, &y, &z); 
pos[z].push back(x); off[z].push back(y); 
} 
build tree(); 
dfs(n); 
printf(" % d\n", max(dp[n][0], dp[n][1])); 
clear(); 
} 
int main() { 
int t; 
scanf("%d", &t); 
fortint i = ,171<=t;4+ i)1{ 
printf("Case # %$d: ", i); 
solve(); 
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return 0; 


12.2.7 E 题 Expection of String(hdu 5576) 


Problem Description: 

青蛙 刚 学 会 了 乘法 ,现在 它 想 做 一 些 练习 。 

它 在 纸 上 写 了 一 个 字符 串 , 只 包括 数字 和 一 个 'X ' 符 号 。 如 果 'X ' 出 现在 字符 串 前 面 或 
后 面 , 它 认为 结果 是 0, 否 则 它 将 按 正常 乘法 来 计算 。 

在 练习 之 后 , 它 想 到 一 个 新 问题 : 对 一 个 初始 字符 串 , 每 次 随机 选 两 个 字符 交换 位 置 ， 
它 交 换 了 一 次 又 一 次 ,例如 K 次 , 它 想 知道 新 字符 串 计 算 结 果 的 期 望 值 。 


可 以 知道 所 有 交换 的 方法 一 共有 [ 2 种 ( 即 (C2)*)。 如 果 期 望 的 结果 是 x, 需要 输出 
n . 
整数 xX (2) 
Input: 
第 1 行 是 一 个 整数 工 ,表示 测试 用 例 的 个 数 。 
每 个 测试 用 例 的 第 1 行 是 一 个 数 ,表示 青蛙 交换 字符 的 次 数 。 
每 个 测试 用 例 的 第 2 行 是 青蛙 操作 的 字符 串 , 只 包括 数字 和 一 个 乘法 操作 符 '* '。 
Output: 
对 每 个 测试 用 例 ,需要 先 输出 "Case # x: y" ,其 中 工 表示 第 几 个 用 例 , 从 1 开始 计数 ; y 
是 结果 。 
于 y 可 能 很 大 ,用 10 十 7 取 模 。 
Limits: 
<T<100; 
字符 串 长 度 为 L; 
70% 的 数据 ,1 二 L<10,0<K<5; 
95% 的 数据 ,1L 志 20,0K<20; 
100% 的 数据 ,1<L50,0K 志 50。 


Sample Input Sample Output 


2 Case #1:2 
1 Case 井 2: 6 
lx*2 


【题解 】 
难度 等 级 : 难题。FB 时 间 是 118 分 钟 。 部 分 金牌 队伍 做 出 ,AC 时 间 在 230 分 钟 左右 。 
能 力 考 核 : DP、 人 逻辑 思维 编码 能 力 。 
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本 题 的 逻辑 很 复杂 ,数据 大 ,是 典型 的 难题 ,综合 考查 逻辑 算法、 编码 等 多 方面 的 能 力 。 
题目 的 要 求 是 一 个 字符 串 由 数字 和 'X ' 号 组 成 ,每 次 操作 可 以 交换 其 中 任意 两 个 符号 


(包括 'X), 问 次 操作 后 所 有 可 能 结果 的 和 。 


样 例 1, 字 符 串 "1 * 2" ,交换 一 次 ,结果 有 (C?)x 一 (C3) 一 3 种 情况 , 即 x*12、2x1、12x 。 


= 2 
期 望 值 x Bn 了 ,输出 工 X(C?) 3 X= 


样 例 2, 字 符 串 "1 * 2", 交 换 两 次 ,结果 可 能 有 (Cs)* 二 


1*2 
(G3)* 二 9 种, 分别 是 1*2、21 * 、x*21、x*21、1*2.21x*、21x、 SS 
a 类 #21 
*21、1*2, 如 图 12.3 所 示 。 期 望 值 zx 一 5 十 十 了 一 了 ,输出 / #21 
xzX(CI)=PX9=6,。 所 
本 题 如 果 用 暴力 的 方法 ,逐一 检查 每 个 结果 ,可 能 有 (C2)* 过 el 
(C8)” 种 情况 ,数据 太 大 ,不 可 能 进行 计算 。 gg 

用 DP 实现 ,关键 是 递 推 式 ,复杂 度 为 OOKZ) 。 

下 面 是 出 题 人 提供 的 代码 。 | 


# include < bits/stdc++.h> 
using namespace std; 
#define 11 long long 
int K,n; 
const 11 mod = 1000000007; 
11 dp[2][55][55][55]; 
11 ten[55], tot[55], tot 2[55][55]; 
string str; 
int main(){ 
int T; 
int cas = 1; 
cin>>T; 
ten[0] = ten[1] = 1; 
for (int i = 2; i<=50; i++) 
ten[i] = ten[i 一 1] * 10 % mod; 
while (T-- ) { 
cin>>K>> str; 
n= str.size(); 
int now = 0; 
for (int 4 = O07 1<n) 1411+) 
if (str[i] == '*')f{ 
for (intj = 0; j<n; j++) 
for (intk = j++ 17kE<n kit) 
证 (str[j] == '*'|| str[k] == '*') 
dp[now][il[j][k] = 0; 
else 
dp[now][i][j][k] = (str[j] - '0') * (str[k] — '0'); 
} 
else { 
for (intj = 0; j<n; j++) 
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for (intk = 0; k<n; k++) 
dp[now][il[j][k] = 0; 
} 
11 lamb; 
if (n<=3) lamb = 1; 
elselamb = (n—- 3) * (n- 4)/2+1; 
for (int iter = 0; 让 er <K; iter++) { 
now = 1 — now; 
for (int i = 0; i<n; i++) 
for (intj = 0; j<n; j++) 
for (intk = 0; k<n; kt+) 
dp[now][il[j][k] = 0; 
Tor (nt = 07 < je) 
ortintk 3 LE 
tot_2[j][k] = 0; 
for (int i = 0; i<n; i++) 
if (i!= j&&i!= k) 
tot_2[j][k] += dp[1 - now][i][j][k]; 
tot 2[j][k] % = mod; 
} 
for (int i = 0; i<n; i++) { 
for (int j] = 0; j<n; j++) 
if (i!= j){ 
tot[j] = 0; 
for (int k = 0; k<n; k++) 
if (k!= is&ki= j) 
tot[j] += dp[1 - now][i][min(j,k)][max(j,k)]; 
tot[j] % = mod; 
} 
for (intj = 0; j<n; j++) 
ei ly 
if (j!= isskI= i){ 
dp[now][il[j][k]+= dp[1 - now][i][j][k] * lamb; 
dp[now] [i][j][k] += tot[j] ~ dp[1 ~ now] [i][j][k] + mod; 
dp[now][i][j][k] += tot[k] ~ dp[1- now][i][j][k] + mod; 
dp[now][i][j][k] += tot_2[j][k] ~ dp[1~ now][i][j][k] + mod; 
dp[now][i][j][k] += dp[1— now][j][min(i,k)][max(i,k)] 
+ dp[1— now][k][min(i,j)][max(i,j)]; 
} 
} 
for (int i = 0; i<n; i++) 
for (intj = 0; j<n; j++) 
for (intk = 0; k<n; k++) { 
dp[now][i][j][k] % = mod; 
} 
} 
llans = 0; 
for tinEl = = 
for (intj = 0; j <i; j++) 
for (intk = i+ 1;k<n; k++) 
ans += dp[now][i][j][k] * ten[i—j]%modx ten[n— k] %mod; 
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printf("Case # %d: %1lld\n", cast+, ans % mod) 


12.2.8 G 题 Game of Arrays(hdu 5579) 


Problem Description: 

Tweek 和 Craig 是 好 朋友 ,总 在 一 起 玩 。 在 做 数学 作业 的 时 候 , 他 们 发 明了 一 种 新 
游戏 。 

首先 ,他 们 写 了 3 个 数组 A、B、C, 每 个 及 个 数字 。 接 着 ,他 们 在 黑板 上 写 下 : 

A+B=C 

如 果 等 式 满足 ,说 明 从 1 到 N 的 所 有 位 置 A, 十 Bi 一 C; 都 成 立 。 

当然 ,开始 的 时 候 等 式 不 是 都 成 立 。 

很 幸运 ,数组 A、B.C 的 一 些 数字 可 以 改变 ,一 些 不 能 改 。 那 些 可 以 改 的 数字 的 位 置 在 
游戏 前 固定 好 了 。 

在 游戏 中 ,Tweek 先 走 ,然后 两 人 轮流 进行 ,每 次 可 以 改变 一 个 数字 。 

每 一 次 ,游戏 者 可 以 从 一 个 数组 中 选 一 个 可 改变 的 数字 , 减 去 1。 但 是 ,不 能 出 现 负 数 ， 
所 以 被 选中 的 数字 在 做 减法 前 不 能 是 0。 

Tweek 的 目标 是 在 游戏 中 使 等 式 成 立 , 而 Craig 的 目标 是 阻止 。 

当 等 式 成 立时 游戏 结束 ,Tweek 获胜 。 或 者 不 存在 可 能 的 改变 ,A 十 B 天 C( 至 少 有 一 个 
iE[1,N], 使 得 A; 十 B; 关 Ci) ,Craig 获胜 。 

给 定 A、B、C, 以 及 每 个 数组 可 改变 数字 的 位 置 。 本 题 的 任务 是 确定 谁 获胜 。 

Input: 

第 1 行 是 一 个 整数 了 ,表示 测试 用 例 的 个 数 。 

每 个 测试 用 例 的 第 1 行 是 一 个 整数 K ,表示 数组 A.B、C 的 长 度 。 

每 个 测试 用 例 的 第 2 行 和 第 3 行 描述 数组 A。 第 2 行 包 括 N 个 整数 A, ,4,,…',AN, 表 
示 数 组 A 的 元 素 。 第 3 行 包 括 N 个 整数 ui, ,…'un' 如 果 A, 可 改 ,w 是 1, 否 则 ww 是 0。 

每 个 测试 用 例 的 第 4 行 和 第 5 行 描述 数组 B。 第 4 行 包括 N 个 整数 B1,B,,… ,Bn, 表 
示 数 组 B 的 元 素 。 第 5 行 包括 N 个 整数 w ,vw,…',uv* 如 果 有 ;可 改 ,w 是 1, 否则 vw 是 0。 

每 个 测试 用 例 的 第 6 行 和 第 7 行 描述 数组 C。 第 6 行 包 括 N 个 整数 C ,Cs ,…',CN , 表 
示 数 组 C 的 元 素 。 第 7 行 包括 N 个 整数 wyrz,…',rzov, 如 果 Ci 可 改 ,w; 是 1, 和 否则 rw 
是 小 

Output: 

对 每 个 测试 用 例 ,需要 先 输出 "Case #x: y" ,其 中 工 表 示 第 几 个 用 例 , 从 1 开始 计数 ; y 
是 获胜 者 。 

Limits: 

1 委 T 委 2000; 

75% 的 数据 ,1<N<10; 

95% 的 数据 ,1<N<50; 
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100% 的 数据 ,1 二 N100; 
0<A;,B;,C;<10°; 
uisvi、wi 值 为 0 或 1。 


Sample Input Sample Output 


3 Case #1: Tweek 
2 Case #2: Craig 
43 Case #3: Tweek 


【题解 】 

难度 等 级 : 本 题 是 “难题 "。FB 时 间 是 188 分 钟 。 部 分 金牌 队伍 做 出 ,AC 时 间 在 270 
分 钟 左右 。 

能 力 考核 : 数学 .逻辑 思维 、 编 码 能 力 。 

本 题 综合 考查 逻辑 .算法 ` 编 码 等 多 方面 的 能 力 。 

下 面 是 出 题 人 提供 的 代码 。 


#include < bits/stdc++.h> 
using namespace std; 
const int N = 1100; 
int a[N], b[N], c[N], ta[N], tb[N], tc[N], n, d[N], add[N], del[N]; 
bool check() { 
int tot = 0; 
for(int i = 1; i<=n; ++ i){ 
dl = alil # ha = elil; 
add[i] = a[i] * ta[i] + b[i] * tb[i]; 
del[il = c[il] * tc[i]; 
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tot += abs(d[i]); 
for(int i = 1; i<=n; ++ i){ 
if((d[i] >0 g&& d[i] > add[i] - del[i]) || 
(d[i] <0 && — d[i] > del[i] - add[i])) 
return 0; 
if((d[i] >=0 g&& d[i] <add[i] - del[i]) || 
(d[i] <=0 && — d[i] <del[i] - add[i])) { 
if(tot - abs(d[i]) > abs(d[i])) 


return 0; 


} 
return 1; 
) 
void solve(int cas) { 
scanf("%d", &n); 
for(int i = 1; i<=n; ++ i) scanf("%d", a + i); 
for(int i = 1; i<=n; ++ i) scanf("%d", ta + i); 
for(int i = 1; i<=n; ++ i) scanf("%d", b + i); 
for(int i = 1; i<=n; ++ i) scanf("%d", tb + i); 
rc=n + mt(" Vd et Ds 
和 


for(int i = 
for(int i = 
int win = 1; 
for(int i = 1; i<=n; ++ i)f{ 
if(a[li] + b[i] {= c[i]){ 
win = 0; 
break; 


} 
if(win){puts("Tweek"); return;} 


for(int i = 1; i<=n; ++i){ 


if(ta[i] && a[i] > 0){ 
td 
if(check()){puts("Tweek");return;} 
aL] ++3 
} 
if(tb[i] && b[i] > 0) { 
MM] 
if(check()){puts("Tweek");return;} 
Ba ++ 
人 
if(tc[i] && c[i] >0) { 
c[i] ——; 
if(check()){puts("Tweek");return;} 
[i 
} 
} 
puts("Craig"); 
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return; 
} 
int main(){ 
int t; 
scanf("%d", gt); 
for(int i = 1; i<=t; ++i)1{ 
printf("Case # %d: ", i); 
solve(i); 
} 


return 0; 


12.2.9 1 题 Infinity Point Sets(hdu 5581) 


Problem Description: 

这 个 故事 来 自 一 位 古老 的 青蛙 哲学 家 写 的 古书 。 

什么 时 候 会 是 世界 的 尽头 ? 也 许 最 好 的 理解 方法 是 使 用 几何 进行 计算 。 

起 初 ,应 该 在 一 张 纸 上 画 几 个 点 。 每 次 选择 两 个 点 并 用 线段 连接 起 来 。 当 有 两 个 线段 
交叉 时 ,在 交叉 点 上 产生 一 个 新 点 ,将 该 点 添加 到 纸 上 ,并 尝试 像 之 前 一 样 将 其 与 前 面 的 点 
连接 。 

应 该 一 次 又 一 次 地 执行 此 操作 ,继续 绘制 线段 ,并 在 可 能 的 情况 下 添加 点 ,直到 没有 新 
线段 为 止 。 然 后 是 世界 的 尽头 , 旧 的 青蛙 会 死亡 ,新 的 时 代 将 开始 。 

如 你 所 见 ,不 同 的 初始 点 导致 不 同 的 结果 。 对 于 一 些 点 集合 ,世界 的 末日 永远 不 会 到 
来 ,我们 称 之 为 无 穷 大 集合 。 

现在 给 NN 个 点 ,在 这 N 个 点 的 所 有 可 能 子 集 ( 不 包括 空 集 , 所 以 总 共 将 有 2 一 1 个 集 ) 
中 有 多 少 个 不 是 无 穷 大 ? 

Input: 

第 1 行 是 一 个 整数 工 ,表示 测试 用 例 的 个 数 。 

每 个 测试 用 例 都 以 整数 N 开始 , 它 表 示 点 的 数量 。 

在 下 面 的 N 行 中 ,第 i 行 包含 两 个 整数 x; 和 ,表示 第 ;点 的 坐标 (zi,yi)。 

Output: 

对 每 个 测试 用 例 ,需要 输出 “Case # x: y”, 其 中 工 表 示 第 几 个 用 例 , 从 1 开始 计数 ; y 
是 结果 。 
由 于 y 可 能 很 大 ,用 10 十 7 取 模 。 
Limits: 

1 委 T 委 10; 

90% 的 数据 ,1 夺 N 志 100; 
100% 的 数据 ,1 二 N1000; 
1 委 ziy< 魏 104; 

没有 一 对 具有 相同 坐标 的 点 。 
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Sample Input Sample Output 


2 Case #1: 15 
4 Case 井 2: 30 


【题解 】 

难度 等 级 : 本 题 是 “难题 ”。FB 时 间 是 197 分 钟 。 部 分 金牌 队伍 做 出 。 

能 力 考核 : 几何 、 逻 辑 思维 、 编 码 能 力 。 

本 题 综合 考查 逻辑 ,算法 ,编码 等 多 方面 的 能 力 。 题 目 大 意 是 给 出 二 维 空间 里 个 点 的 
坐标 , 求 有 多 少 个 不 同 的 子 点 集 不 是 无 限 点 集 。 无 限 点 集 的 定义 是 将 点 集中 的 点 两 两 相连 ， 
将 线段 产生 的 交点 再 加 入 点 集中 ,继续 上 面 的 操作 ,如 果 操 作 能 够 无 限 地 进行 下 去 , 则 称 之 
为 无 限 点 集 。 

图 12.4 所 示 的 4 种 情况 不 是 无 限 点 集 。 


A Xl 和 全 


图 12.4 I 题 


(1) 任意 1、2、3、4 个 点 。 


(2) 3 点 以 上 共 线 十 两 侧 各 一 点 。 生 成 的 新 的 黑色 的 点 也 在 线段 上 ,操作 不 会 无 限 地 
(3) 4 点 以 上 共 线 十 任意 一 点 。 这 种 情况 不 会 产生 交点 ,操作 也 
不 会 无 限 进行 。 


(4) 5 点 及 以 上 共 线 。 
无 限 点 集 的 情况 例如 图 12. 5 所 示 。5 个 外 面 的 点 ,交点 为 5 个 
内 部 的 点 ,这 样 的 操作 能 够 无 限 地 进行 下 去 。 
下 面 是 出 题 人 提供 的 代码 。 a 


#include < bits/stdc++.h> 
typedef long long LL; 

using namespace std; 

const int V = 1100; 
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const int N = 1000; 
const int P = 1000000007; 
int rev[V], pt[V], C[V][V]; 
int Pow(int x, int y){ 

int ret = 1; 


while(y){ 
if(y &1) ret = (LL) ret * x % P; 
这 二 (I 天 
y/= 2; 

由 

return ret; 


是 
void init(){ 
for(int i = 1; i<=N; ++i) 
rev[i] = Pow(i, P — 2); 
pt[0] = 1; 
for(int i = 1; i<=N; ++i) 
pt[i] = pt[i- 1] * 2 %P; 
memset(C, 0, sizeof(C)); 
for(int i = 0; i<=N; ++i){ 
Cc[il[0] = C[il[i = 1; 
for(int J = 171< 4) 
c[il[j] = (Cl[i = 1][j ~- 1] + Cli ~ 1][j]) % P; 


struct Point{ 
nt x 生 7 
p[V]; 
struct PNode{ 
int x, Y revy 


Node[ V]; 
bool EQ(PNode x, PNode y){ 
if(x.x == y.x && x.x == 0) return true; 


if(x.x * y.x<0) return false; 


return X.X * 了 .了 == X.Yy * y.x; 


bool Nodecmp(PNode x, PNode y){ 
if(x.x * Y.X<=0) return x.x>y.x; 
if(x.x * yy!= x.y * y.x){ 
if(x.x>=0) return x.x * y.y> Xx.y * y.x; 
else return x.x * 了 .了 > xXx.y * 了 .Xi 


} 
return x. rev < y. rev; 
dt 


/* 分 为 几 部 分 : (1) 5 点 及 以 上 共 线 ; (2) 任意 1、2、3、4 个 点 ; 
(3) 4 点 以 上 共 线 + 任意 一 点 ; (4) 3 点 以 上 共 线 + 两 侧 各 一 点 */ 
int sol_ line(int ln, int rn, int revn, int nown, int total){ 
int ans = 0; 
for(int i = 4; i<=]n + rn; ++i) 
ans = (ans+ (LL)C[ln+ rn][i]* rev[i+1]%P)S%P; 
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for(lint i = 3; i<= n+ rm; ++1) 
ans= (ans+ (LL)C[ln+ rn][i]*rev[i+1]%Px(n-ln-rn—-1)%P)%P; 
intD = revn 一 nown; 
intA= ren-D- rn; 
inte = total = A= l= rn; 
iw CD = 6 4 Ds 
i 0D 
for(int i = 2; i<=]n + rn; ++i) 
ans = (ans+ (LL)C[ln+rn][i]*rev[i+1]%PxAB%Px*CD%P)S%P; 


return ans; 


int mid way[V]; 
int sol(){ 
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int ret = 
for(int i = 1; i<=4; ++i) 
ret = (ret + C[n][i]) % P; 
for(int i = 0; i<n; ++i){ 
int revn = 0; 
for(int j = 0; j<n; ++j){ 
Node[j].x = p[j].x - plil.x; 
Node[j].y = p[j].Y - plil.y; 
if(Node[j].y<0 || (Node[j].y == 0 && Node[j].x<0)){ 
Node[j].x = - Node[j].x; 
Node[j].y = - Node[j].y; 
Node[j].rev = 1; 
++revn; 


} 
else Node[j].rev 


=1; 
} 
sort(Node, Node + n, Nodecmp); 
int ln = 0, rn = 0, midn = 0, nown = 0, total = 0, pre = -1; 
for(int j = 0; j<n; ++j){ 

if(Node[j].x == 0 && Node[j].y == 0) continue; 


if(pre != —1 && !EQ(Node[j], Node[pre])){ 
ret += sol line(ln, rn, revn, nown, total); 
ret % = P; 


mid way[midn++] = (LL) ln * rn % P; 
lIn=rn=0; 
} 
if(Node[j].rev == -1) ++ln; 
else tt+nown, ++rn; 
++total; 
pre = j; 
} 
mid_way[midn++] = (LL) ln * rn % P; 
ret += sol line(ln, rn, revn, nown, total); 
ret %= P; 
int mids = 0; 
for(int j = 0; j <midn; ++j) mids = (mids + mid way[j]) % P; 
for(int j] = 0; j <midn; ++j){ 
ret = (ret— (LL)(mids— mid way[j]) *mid way[j] %Pxrev[2] %P)%P; 
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if(ret <0) ret += P; 


} 

return ret; 
} 
int main(){ 


init(); 
scanf("%d", & ); 
for(int ca = 1; ca<= ; ++ca){ 
Scanf(" %d", gn); 
for(int i = 0; i<n; ++i) 
scanf("%d%d", gp[i].x, &p[i].y); 
printf("Case # %d: %d\n", ca, sol()); 
} 


return 0; 
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